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CAPITOLUL. | 
NOȚIUNI GENERALE 


[.1. Scurt istoric 


Activitatea umană de cunoaștere a lumii 
înconjurătoare, de obtinere a bunurilor materiale și 
spirituale s-a amplificat si diversificat ca urmare a 
perfecţionării instrumentelor de cunoaştere și analiză a 
fenomenelor sociale și economice și a mijloacelor de 
producere a acestor bunuri. 

Statistica ocupá un loc important in cadrul Științelor 
sociale și are o arie foarte largă și variată de cercetare, 
datorită complexității si diversității fenomenelor vietii 
sociale. 

În evoluția ei de-a lungul secolelor, staiistica și-a 
diversificat aria de investigaţie, perfectionándu-Si, totodată, 
metodele sale de lucru. Drumul lung și sinuos parcurs de 
statistică a fost același ca și al tuturor ştiinţelor: de la 
necesitățile practice la elaborări teoretice. 

Toate popoarele care posedă o istorie scrisă 
posedă si rudimente de lucrări statistice întocmite de 
„administratorii guvernamentali în vederea rezolvării unor 
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probleme de ordin financiar, militar, fiscal, social, etc. 
Astfel de lucrări, in special recensăminte, destinate pentru 
a evidentia resursele umane si materiale ale statelor, au 
tost intocmite in Antichitate, in Egipt. Grecia, Roma, etc. 

Prima analiză statistică, in spirit ştiinţific, a unor 
date, este datorată lui John Graunt (1620-1674) care, pe 
baza datelor deceselor înregistrate în Londra acelor ani a 
izbutit să tragă concluzii valabile asupra unor fenomene 
sociale, cum ar fi natalitatea și mortalitatea, echilibrul 
numeric. 

Denumirea de “statistică” a apărut pentru prima 
oară în limba germană (“statistik”) si derivă de la cuvântul 
latin "síatus" care se traduce prin stat sau stare de lucruri. 
Termenul a fost introdus în secolul al XVill-lea de 
profesorul Gottfried Achenwall de la Universitatea din 


Gottingen. 


Dezvoltarea teoriei probabilităților a constituit, fără 
îndoială, un mare pas înainte nu numai pentru știința 
statisticii, ci şi pentru întreaga istorie intelectuală a 
omenirii. Ecuația curbei normale a fost publicată în 1733 
de Abraham de Moivre, iar lucrările acestuia au fost 
dezvoltate ulterior în mod independent de Laplace și 
Gauss. Astăzi, curba normală poartă de obicei numele 
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savantului german C.F.Gauss (1775-1855), unul din 


savanții care au adus cele mai importante contribuții la 
dezvoltarea statisticii moderne, prin elaborarea metodei 
celor mai mici pătrate. 

O contribuţie importantă în direcția folosirii statisticii 
ca instrument de lucru în științele sociale și-a adus-o 
belgianul Adolphe Quetelet (1796-1874) care a dat un nou 
impuls teoriei și practicii statisticii nu numai prin lucrările 
sale, ci şi prin inițiativele sale organizatorice: el a organizat 
primul Congres internaţional de Statistică în 1853. 
Contribuţia sa la dezvoltarea științelor sociale a constat, în 
special, în evidentierea variabilitátii fenomenelor sociale și 
economice de masă în jurul unor medii. 

Aspectul variational a reprezentat. un concept 
central în teoria selecţiei naturale a lui Darwin (“Originea 
speciilor”, 1859). Darwin nu a avut nici o contribuție în 
statistică, dar el a creat contextul teoretic, bazat pe 
observaţii, ca studiul variaţiei să constituie o necesitate 
pentru rigurozitatea Ştiinţifică. 

„Adevăratul început al statisticii modeme poate fi 
lea odată cu 


1936), care a 


considerat la începutul secolului al XX- 
dezvoltarea lucrărilor lui Karl Pearson (1857- 
pus bazele statisticii inductive (inferentiale) prin elaborarea 


testelor privitoare la semnificatia diferențelor dintre valorile 
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calculate şi cele empirice, toate acestea pornind de la 
ideeea de a conferi o bază matematică pentru teoria 


evoluționistă. Între anii 1894 și 1916 el a publicat 19 lucrări / 


si monografii pe teme statistice, lucrări de o mare 
importanță, intitulate “Contribuţii la teoria matematică a 
evoluției”. 

R. A. Fischer (1890-1962) a dezvoltat analiza 
variaţiei, iar între anii 1920 și 1960 și-a dedicat timpul 
studierii problemelor statistice din științele biologice 
(“Metode statistice pentru cercetări ştiinţifice”) ȘI 
fundamentărilor matematice în genetică. 
| Desi, atât K. Pearson cât si R. A. Fischer au fost 
preocupaţi, in primul rând, de aplicarea metodelor 
statistice în biologie și genetică, un câmp larg de aplicare 
a teoriilor și metodelor lor s-a deschis, mai ales în 

perioada postbelică, în sociologie și economie. 

În România, prima lucrare de statistică descriptivă o 
reprezintă “Descriptio Moldaviae” a lui Dimitrie Cantemir 
(1714), o monografie cu caracter geografic, politic, 
economic, social și cultural, care îl impune pe autorul ei 
printre fruntașii statistcii europene. 
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1.2. Obiectul, metoda si etapeie cercetării statistice 


în dezvoltarea sa, statistica s-a ocupat de acele 


fenomene si procese care se produc într-un număr mare - 


de cazuri, denumite fenomene de masă sau fenomene de 
tip colectiv. În toate domeniile (societate, economie, 
natură, tehnică, etc.) fenomenele (procesele) pot apare ca 


rezultat al unei singure cauze sau ca rezultat a mai multor 


cauze care se manifestă izolat sau în interdependentà. 

Deși la nivelul unităţilor individuale se manifestă o 
mare variabilitate în timp și spațiu, tendința lor de 
manifestare nu poate fi cunoscută și verificată decât la 
nivelul ansamblului, la nivelul de masă al fenomenelor. 
Acest lucru este posibil deoarece toate fenomenele de 
masă se află sub incidenţa legii numerelor mari, potrivit 
căreia variațiile întâmplătoare de la tendinta centrală se 
compensează reciproc într-un număr mare de cazuri 
individuale luate în studiu. 

Obiectul _de studiu * al statisticii se poate defini 
astfel: statistica studiază, sub formă numerică, variaţia 
fenomenelor de masă, fenomene care sint supuse 
legilor statistice, care se manifestă în condiții concrete 


variabile în timp și în spațiu. 
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Statistica, și-a elaborat un ansamblu de metode 
ştiintifice, care ne învață cum să organizám observarea 
fenomenelor de masă $i să obținem datele necesare, cum 
să prelucrăm aceste date și cum să formulăm ipoteze 
privitoare la relațiile evidenţiate de aceste date. Ea oferă 
metode pentru testarea ipotezelor noastre și pentru 
confruntarea realității cu predicțiile ce le putem formula pe 
baza ipotezelor, permițând deci extinderea cunoașterii 
fenomenelor studiate. 
| Metodele de investigație statistică sînt abezh 
de totalitatea principiilor metodologice, procedeelor și 
“tehnicilor: de investigare statistică a fenomenelor ce 
aparțin unor procese de masă. | 
Utilizarea metodeior statistice impune fobio unui 
limbaj științific comun, util în raportarea la cercetări 
similare aceluiași fenomen 'sau la unele studii din 
discipline ştiinţifice apropiate. Metodele de investigație 
statistică se folosesc în studji concrete ale fenomenelor de 
masă și ele se diversifică în Puneti de cele tr rei: etape « ale 
unei cercetări statistice: 
e observarea statistică; 
e prelucrarea statistică adátelor, 
* analiza si interpretarea statistică. ' 
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Observarea statistică, prima etapă a oricărei cercetări 
statistice, constă în înregistrarea datelor, după 
criterii unitare, privitoare la caracteristicile colectivității 
supuse cercetării. Este o etapă importantă a 
cercetării statistice întrucât de autenticitatea datelor 
obținute în această etapă depinde calitatea întregii 
cercetări. Trebuie să se aleagă date pentru toate 
unitățile colectivităţii astfel încât, prin prelucrarea lor, să 
se poată desprinde regularitățile care se manifestă în 
cadrul colectivități; 
Prelucrarea statistică reprezintă cea de a doua etapă a 


cercetării statistice, în care se centralizează Si se 
sistematizează datele culese în prima etapă, se 
calculează sistemul de indicatori statistici cu care se 
caracterizează numeric fenomenele și procesele 
studiate şi se prezintă rezultatele prelucrării sub formă 
de tabele, serii și grafice; 

Prin prelucrarea datelor o 


de la datele individuale ia date şi informaţii care permit 
întregii colectivități cercetate. 


bservării se asigură trecerea 


caracterizarea 
Prelucrarea statistică presupune sintetizarea Și 
compararea datelor, astfel încât să se elimine ceea ce 


este întâmplător Si neesential în producerea Si 
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manifestarea fenomenului studiat.  Prelucrările 
statistice reduc si elimină uneori subiectivitatea 
cercetătorului, contribuind la sporirea obiectivitátii 
stiintifice. 

| | Procesul de investigaţie statistică se încheie cu analiza 


Şi interpretarea rezultatelor și cu formularea concluziilor 


statistice. Efectele utilizării instrumentului matematic 


sunt benefice pentru creșterea eficienţei procesului 
instructiv-educativ, cu condiţia ca fenomenele studiate 
să poată fi cuantificate, iar prelucrările statistice să fie 
urmate de interpretări competente pentru a deveni 
suportul unor intervenții ameliorative. | 


- culegerea datelor individuale de masă 


- sistematizarea datelor individuale; 
- calcului sistemului de indicatori statistici; 
- prezentarea datelor prin tabele, serii şi 

grafice. 


Fig. 1.1. Etapele cercetării statistice 


nai 
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13. Principalele noțiuni folosite în cercetarea statistică 

Pentru a evita interpretările greșite în statistică și 

pentru a crea un cadru comun tuturor activităţilor 

investigate cu metodele statistice se utilizează termeni de 

bază care se regăsesc în toate cele trei etape ale 
cercetării statistice: 

| Colectivitatea (populatia) statistică reprezintă 

totalitatea elementelor sau faptelor individuale de același 

fel care formează obiectul cercetării. Colectivitatea 


statistică are un caracter obiectiv, concret și finit. Ea 
trebuie delimitată precis în timp și în spațiu în cazul 
oricărei cercetări statistice. De exemplu: populația 
României, totalitatea studenţilor de la facultăţile cu profil 
de educatie fizică și sport, etc. | 
2. Unitatea statistică este elementul individual al 
colectivităţi. Unităţile statistice pot fi simple (persoana, 
sportivul) si complexe (familia, echipa, etc). Unitățile 
complexe sunt formate din mai multe unități simple. 
3. Caracteristica statistică reprezintă însușirea comună 
tuturor unităților colectivităţii. Unităţile sunt purtătoare ale 
unor caracteristici variabile ca nivel de dezvoltare sau 
: formă de manifestare. Ele se mai numesc variabile 
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statistice. De exemplu: vârsta, sexul, etc. Se disting 
astfel variabile independente cărora li se pot atribui toate 
“valorile cuprinse într-o anumită mulțime și variabile 
dependente ce pot fi determinate pe baza unei relații sau 
metode precizate în raport cu variabilele independente. 
De exemplu, dacă se cercetează vaioarea unei metode 
didactice nou introdusă, aceasta reprezintă variabila 
independentă (cauză), iar progresul elevilor în termeni de 
randament școlar - variabila dependentă (variabila efect). 


4. Esantionul este un subansambiu al unei populaţii 


alcătuit prin extragere de elemente din populația de bază. 
Extragerea se face după reguli precis stabilite, în functie 
de scopul analizei statistice și de natura datelor 
observaţiei. Concluziile pot fi extinse apoi asupra întregii 
populații, bineînțeles cu o anumită marjă de eroare, care 
poate fi calculată. 
S indicatorul statistic reprezintă expresia numerică cu 
un conţinut real și o formă specifică de exprimare, obținută 
în urma efectuării unei cercetări statistice. Orice indicator 
„statistic este format din: partea care lámureste conţinutul 
indicatorilor, o parte care specifică timpul și spațiul la care 
se referă și expresia numerică. De exemplu, talia medie 
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ÎI aaaaŘaŘŘŘaaauululuauluaaiaiÃiaiasaIassssass 
înregistrată la școlarii clasei a IV-a (băieți) în municipiul 
laşi în anul 199... a avut valoarea de x cm. 

€. Datele statistice sunt caracterizări numerice ale 
unităților, obtinute din observare și prelucrare. 

7. informaţia statistică este mesajul dateior statistice. 

8. Frecventá sau pondere, reprezintă numărul de unitati 
la care se înregistrează aceeași variantă sau valoare. 

9. Seriile statistice sunt rezultatul grupării datelor dupa 
una sau mai multe. caracteristici de grupare. Dacă datele 
observári se grupează în funcție de o singură 
caracieristică rezultă serii simple. Seriile statistice de 
distributie reprezintă o  corespondentà între valorile 
caracteristici şi frecvențele unităților la care se 


înregistrează aceeași vanantă. 
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.. CAPITOLUL II 
DISTRIBUTIA DE FRECVENTE 


SI REPREZENTAREA El GRAFICĂ 


Il.1. Distribuţia de frecvențe 


Datele obținute din desfășurarea experimentelor 
reprezintă de cele mai multe ori o colecţie de numere. 
Aranjarea, clasificarea acestora pot ajuta cercetătorul să 
înțeleagă natura trăsăturilor esenţiale a datelor recoltate și 
pot reduce chiar numărul calculelor matematice. 

Distribuţia de frecvență este reprezentată de o 
ordonare (aranjare) a datelor care arată frecvența de 


 aparitie a diferitelor valori ale unei variabile. 

Să considerăm următorul sir de date (Tabelul 2.1) 
reprezentând numărul total de puncte obţinute de 100 
elevi după trecerea unor probe de conirol. 

Ca prim pas este necesară scrierea (așezarea) 
datelor în ordine, de exemplu de la cea mai mare valoare 
(134) la cea mai mică (67), putându-se face ordonarea și 
în sens crescător . La o primă inspecţie se observă că 
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anumite valori apar de mai multe ori (2 de 121, 3 de 111, 
4 de 109, etc.) ceea ce ne-ar permite reașezarea datelor 


Ordonarea datelor înregistrate la trecerea probelor de control 
Tabel 2.1 


ECE TR E 
INCREASE e 
MAAE 


în coloane, una conţinând numărul punctelor acumulate 
de elevi, iar cealaltă de câte ori acest număr apare (se 
repetă), O astfel de rearanjare (Tabelul 2.2) poartă numele 
de serie de distributie a frecventelor, iar numărul de 
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repetări al fiecărei valori îl reprezintă frecvenţa (notată cu 


f). 


Tabel de distribuţie a frecvenţelor valorilor obținute | 
la trecerea probelor de control 


Tabel 2.2 


ec etm ad ata a Pa calci epi MAT 
Batpet xl păi CIO m Er. 
CHO ip A e LV a amanata Ti 


134 95 117 
133 =a 116 
132 == 115 
131  *—3 114 
130 


129 | 
ps -a lll 
127  :— 3 r 110 
126 


CÓ 


În tabelul 2.2 datele sunt ordonate în tot atâtea 
clase câte valori sînt (de la 134 la 67), respectiv 68 de 
clase, ceea ce reprezintă un număr destul de mare a 
acestora. De obicei se recurge la reducerea numărului de 


clase prin aranjarea datelor în grupuri; de pildă, cifrele de 
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la 134 la 130 sau de la 80 la 84 pot fi grupate împreună, 
aşa cum este redat în tabelul 2.3. 


Tabel de distribuţie al frecvențelor valorilor obținute 
la trecerea probelor de control 


Tabel 2.3 


Diferența dintre tabelele 2.2 și 2.3 este dată de 
intervalul de clasă ales, care este 1 pentru primul tabel și 5 
pentru cel de-ai doilea precum și de numărul de clase care 
este 68, respectiv 14. În felul în care sînt aranjate datele 
în tabelul 2.2 cu intervalui de clasă egal cu 1, şirul original 
de date (ordonate) poate fi reconstituit ușor după 
| 
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frecvenţă, fără a pierde vre-o informaţie. Dar dacă 
intarvalul de clasă ales este mai mare decât 1 o parte din 
valorile individuale se vor pierde, deci șirul original nu va 
putea fi reconstituit exact după frecvențe, iar pierderea 
unor informaţii (date) este inevitabilă. Ca urmare s-au 
impus câteva convenții pentru alegerea numărului de 
clase şi a mărimii intervaluiui de clasă: 

1. numărul de clase să fie de minim 10 Si de maxim 20 de 


clase. De exemplu, dacă valoarea minimă dintr-un sir 


de observaţii este 7, iar cea maximă 156, un interval de 


clasă ales de 10 va conduce la obținerea unui număr de 
16 clase. Dacă valoarea minimă este 2, iar cea maximă 
este 38, putem obține 14 clase (cu intervalul de clasă 
de 3). Dacă într-un şir minimul este 9 iar valoarea 
maximă este 20, un interval de clasă de 1 va conduce, 
așa cum ar fi recomandabil, la 12 clase. 

. 2. intervalul de clasă ales să fie de 1, 2, 3, 5, 10 sau 20. O 
formulă des utilizată pentru calcularea intervalului de 
clasá este: 


] | 
į = —x8 — y...) „unde 


i = intervalul de clasă; 
Xmax = valoarea maximă din sir; 
Xin ^ valoarea minimà din sir. 
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Pentru datele din tabelul 2.1, de exemplu, avem: 


ja x x8(134-67)- ETUE 


= 5,36 
0 


deci rotunjit 5, aşa cum am procedat Si exemplificat in 

tabelul 2.3. 

3. pe cát posibil, intervalul de clasá sá fie un numár impar, 
iar centrul intervalului de clasă (despre care vom vorbi 
imediat) să fie un număr întreg. 

4. valorile de început ale claselor este recomandabil să 
fie multiplii ai intervalului de clasă. De exemplu, pentru 
un interval de clasă de 5, clasele încep cu 5, 10, 15, 20, 
etc. (în tabelul 2.3 - 130, 125, 120, 115 ... sînt multiplii 
de 5). 

5. aranjați clasele in ordine descrescătoare, plasând 
valorile cele mai crescute la începutul zii i de sus) 


coloanei. 
Pentru calcularea diferiților indicatori statistici sau 
pentru a reprezenta grafic o distribuţie de frecvențe este 
necesară Le ei a încă două Ti importante. 
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(reale)__ale__intervalului__ales. De exemplu, pentru 


înregistrarea vitezei de reacție la un semnal s-a înregistrat 
şi valoarea de 0,196 secunde. Conventional, și pentru a 
conferi acuratețe măsurării, se consideră că limitele exacte 
ale valorii se află cu o jumătate de unitate în plus şi în 
minus față de valoarea observată, în cazul nostru 0,1955 s 
şi 0,1965. Pentru datele din tabelul 2.4 se observă că 
pentru clasa 100-104 limitele exacte ale intervalului sunt 
99,5 si 104,5 cu frecventa de 16. 


Clasele, limitele exacte si valorile centrale ale clasei 
pentru probele de control (viteza de reactie) 


Tabel 2.4 
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Asa cum afirmam, cele 16 valori sunt distribuite uniform 


(egal) după cum urmează: 


Aceasta ne va folosi la calcularea medianei și la 


reprezentarea histogramelor. 
Al doilea aspect se referă la faptul că se consideră 


că toate datele din interiorul unei clase se concentrează în 


jurul valorii centrale a acesteia. Valoarea centrală a unei 

clase se află adunând cele două valori extreme ale clasei 

Şi împărțind rezultatul la doi. De exemplu, pentru clasa 
aleasă de noi 100 - 104, valoarea centrală este: 

100+104 _ 204 

A NS 
sau tinánd seama de limitele exacte ale clasei 
9o 104,5). i6 


= 102 


2 
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Aceasta ne va folosi la calcularea mediei aritmetice. a 
? 


abaterii standard si la reprezentarea poligonului de 


frecvențe. 


1.2. Reprezentarea grafică a distribuției 


în unele cazuri, o prezentare grafică a tabelului de 
frecvențe ne oferă informații mai clare si mai concise 
despre o distribuție de frecvenţă. Există mai multe feluri de 
astfel de prezentări, rezumându-ne în lucrarea de față ia 
cele cu cea mai largă utilizare: histograma, poligonul 


` frecventelor şi curba cumulativă. 
Folosind tabelul 2.5 de frecvență a înregistrărilor 


timpului de reactie auditivă la un număr de 188 de subiecti 


să trasăm histograma corespunzătoare. 


Pe abscisa (Ox) coordonatelor ortogonale, vom 


marca limitele exacte (reale) ale claselor. Pe ordonată 


(Oy) vom trece punctele corespunzánd frecventelor din 


fiecare grupá. Ridicám apoi pe abscisă dreptunghiuri cu 
baza egală si cu înălțimea corespun 
din fiecare grupă. Primul dreptunghi va avea înălțimea de 


1, corespunzătoare numărului de frecvențe din prima 


zătoare frecvențelor 
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clasă, al doilea de 12 si asa mai departe încât obtinem: 


Timpul de reacţie la stimulul sonor 


| 69 


'" Frecvența 


; 0.145 0,165 0,185 0,205 0,225 0,246 0,265 0,285 0,305 0,325 0,345 
mogaj ue pus a ur. Timpul de reacție (S) 


Les 
d 


E EI SIRIA TA BIO SUT ET PA E TED ECC S 7 IEZI ae SES 
Figura 2.1. Histogramă pentru datele din tabelul 2.5. 


“Dacă unim punctele reprezentând valoarea centrală 

a claselor cu linii drepte obținem un poligon al 
frecvenfelot aṣa cum se observă în figura 2.2. 

Se remarcă faptul că distribuția de - frecvență 

“reprezentată în figura 2:2. nu este o linie continuă, ci una 

^ &ántà în fiecare punct de intersecţie al valorilor centrale 


t 

t sosi pas 14-4 e 
H 21 fa * i Li 
Es să SII PE i 
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Timpul de reactie (s) 


Figura 2.2. Poligonul frecvențelor pentru datele din tabelui 2.5. 


Trasarea curbei cumulative se aseamănă cu cea a 


poligonului de frecvenţă, diferind de acesta prin două 
aspecte: 

1. se folosesc frecvențele cumulate în locul celor 
simple; | 

2. de pe abscisă se ridică verticala corespunzătoare 
limitei superioare exacte a clasei Si nu a valorii centrale 
(mijlocul) a acesteia. Se procedează astfel deoarece se 
urmărește ca graficul nostru să redea exact numărul de 
cazuri de deasupra sau dedesubtul unei valori. 
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Curbele frecventelor cumulate permit localizarea în 
cadrul intervalului total de variaţie a claselor cu frecvenţe 
mari (panta mai accentuată) sau mici (pante mai reduse). 
Importanța lor rezultă însă din faptul că ele ne oferă 


răspunsul rapid la două întrebări: 
z care este proporția (probabilitatea) cazurilor cărora le 


corespunde o valoare inferioară sau superioară unei 


anumite valori date (prag); 


4 invers, care este valoarea căreia îl corespunde o 


proporție (probabilitate) dată a cazurilor cu valori 
inferioare sau superioare modalității - (valorii) 


respective? 
Să trasăm mai întâi curba cumulativă tinând cont de 


frecventele cumulate din tabelul 2.5. 
. Acum putem da drept exemplu. un răspuns ia 
prima întrebare. Care este proporția (probabilitatea) 


cazurilor care au reacţionat la stimulul sonor în mai mult 


de 0,255s? Ridicând verticala de pe abscisă aceasta 
rba în punctul corespunzător ordonatei la 


întâlnește cu 
prezintă 


valoarea frecventei cumulate 164. Dacă 188 re 
100% din totalul cumulat, 164 va reprezenta 164/188x100, 
respectiv 87,234%. Deci 87,234 dintre subiecţi au răspuns 
la stimul într-un timp mai scurt de 0,255s, iar diferența de 


CE Scanned with OKEN Scanner 


27 


100 - 87.234 respectiv 12,7659%, într-un timp mai 


îndelungat, aceasta fiind soluţia problemei noastra. : 


Timpul de reacţie la un stimul sonor 
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„Frecvența cumulatà 


B - 5 
" 9 ps 
4 
IB - 
A 
3 —————- num 
t M p 


Figura 2. La Curba cumulativă à pentru « datele din tabelul 2.3. 


Invers, cunoscând proportia, putem afla timpul de 
reacție si obtine răspunsul la cea de-a doua întrebare. 

Dacă am considera distribuţia aceasta cu O 

infinitate de clase și trecând de la noţiunea de proporție la 


cea de probabilitate, putem spune că ă probabilitatea de a 
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găsi o valoare inferioară celei de 0,255 este de 0,872 (sau 
87,234%) si de a găsi una superioară este 0,127. 


Exerciţii 


1. Cunoscând valoarea minimă și maximă dintr-un set de 
observaţii, să se stabilească intervalul de clasă, limitele 
intervalului cel mai mic, limitele exacte ale clasei și 


valoarea centrală a acesteia. 


cară nhan iens 
141 - 0,205 


n 
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Se cere să se realizeze o distribuţie de frecvente, 
considerând intervalul de clasă de 5. 


Răspunsuri: 


s.. 
" m -ry % ve prrs h 
——— — rasa aa ae e n ám Ep ee 
0 cw r eei 44 m SLT Dd 
mupu EE A temm 


atai Re mi 
LI - sri 

n 

` Å 


me pe pai ea 
2 Dat ata at cae ia 


-e ste 


-t > prea ntp ireki o map. 
3-4 4 dr è erore x , Ă a, 
eua ca ce dotata e ti estatua att pz or n Dea atzi mr gd 


79,5 - 89,5 


CUN 


po ic Apu EE YES Om WU." a Ug 
aaa EAT pt see Vs riri Er poem ee ati A — 
Ta Lam Ba uos Ag Aman pate pa e teme M net 


= 


a Ep gi aia 
haier ir, asa-i 


an r ara na aaa Ref 39 a aa aa E08 a pe n 
-å a m a ^ p H TA 


2. Clasa cu valorile cele mai mici din șir va fi 35-39, 40-44, 


etc. şi vom avea frecventele: 
5, 4, 4, 8, 11, 12 11,606,275 


D E teme 
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CAPITOLUL Hl 
PARAMETRII TENDINTEI CENTRALE 


Datele obţinute în urma observării caracterizează 
fiecare unitate a colectivitátii care urmează să fie studiată 
şi sunt expresia actiunii unui număr mare de cauze și 
factori care pot acţiona în același sens sau în sensuri 
diferite. Cercetarea statistică presupune însă cunoașterea 
trăsăturilor reprezentative esenţiale ale fenomenelor de 
masă, a regularitátilor de producere a acestora. Aceasta 
înseamnă că este necesară determinarea unor valori 
reprezentative, tipice pentru masa valorilor individuale. 
Pentru caracterizarea numerică sintetică a unei distribuții 
statistice, implicit a curbei de distribuție corespunzătoare, 
se determină (în general) trei tipuri de parametrii (indici), 
fiecare tip descriind anumite caracteristici ale acestora: 


. 


1. parametrii tendinței centrale, 
zona de maximă concentrare a valorilor (zona 
încât în jurul lor se 


ne dau informaţii despre 


frecvenţelor maxime), astfel 
plasează, la distanțe mai mari sau mai mici, celelalte 


valori din şir; 
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2. parametrii  dispersiei, care exprimă gradul de 
imprěştiere a valorilor din Sir în jurul valorilor centrale; 
3. parametrii formei (curbei de distribuţie), care oferă o 
măsură a asimetriei împrăștierii valorilor distribuţiei fată 
de tendința centrală. | 
Parametrii (indicatorii) tendinței centrale cei mai 
frecvent utilizați în analizele statistice sînt 
v media, | 
y medianasSi 


© * modulul. 


Ili.1. Media aritmetică simplă si ponderatá 


Există, de fapt, mai multe feluri de medii. Cea mai 
des întâlnită este media aritmetică, denumită pe scurt, 
media. Ea este rezultatul sintetizării printr-o singură 
expresie numerică a tuturor valorilor individuale 
înregistrate, obținută prin raportarea valorii totalizate ale 
caracteristicii la numărul total al unităților. Calculată pentru 
o colectivitate statistică, media aritmetică este valoarea la 
care ar fi ajuns fiecare unitate înregistrată dacă tcti factorii 


ar fi acţionat în mod constant în toate cazurile. 
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Ill. 1.1. Media aritmetică simplă 


Media aritmetică se obține deci prin însumarea 
elementelor unei serii statistice și prin împărțirea totalului 
la numărul elementelor care formează seria. 

Ea are în statistică două simboluri: 

a) X - pentru media aritmetică a unei populații; 

b)x - pentru media aritmetică a unui eșantion. 
Deosebirea dintre cele două simboluri este importantă, 
deoarece media aritmetică a unei populaţii este o mărime 
fixă (deşi nu o cunoaștem) înainte de a o calcula, pe când 
media aritmetică a esantioanelor poate varia la fiecare 
dintre acestea, dintr-o populație putând fi extrase mai 
multe esantioane care vor avea medii aritmetice diferite. 

Să considerăm următorul sir de date: 7, 13, 22, 9, 
11, 4. Conform definiţiei, suma acestora este 
74135224941144 = 66, iar numărul elementelor seriei 
este 6; in. concluzie, media aritmetică simplă este 11 
(66/6). 


În termeni algebrici, dacă notăm pri 
cu x, a doua cu Xz, ȘI CU X, ultima observatie, iar cu N 


numărul observaţiilor, vom avea pentru întreaga populație: 


ma observație 
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X tX, +X, ted, "É 
N N 
iar pentru un eşantion: 


n 
x: 


Li 


X= 


Ys 
n n 
În cazul nostru : 


7413224941144. 66 _1, 
6 6 | 


Calculul mediei aritmetice este, după cum se vede, 


foarte simplu. 


|11.1.2.Media aritmetică ponderată 


Când ne confruntăm cu o distribuţie de frecvențe, 
pentru calcularea mediei aritmetice, nu mai putem aduna 
observaţiile individuale, fiindcă observaţiile au fost grupate 
în clase. 

Asa încât vom recurge la calculul mediei aritmetice 
ponderate raportànd suma produselor dintre valorile 
caracteristici (x) si frecvența lor de apariţie (f) la totalul 
frecvențelor : | 
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f 
Ji end 


XY = 


De exemplu, pentru datele inregistrate la aruncarea 


mingii medicinale (2kg) înapoi cu ambele mâini, la un 


colectiv de elevi s-au înregistrat următoarele performante 


(Tabelul 3.1): 


Calcularea mediei ponderate la aruncarea mingii 


medicinale înapoi 
Tabelul 3.2 


oaie cătănie îm ame ttg d sot mat. pitt cf apei d iert d de N 
z : m me gas m 
T -e e4- $ A - 


H 
nee pe etrs oi n a 
M tie 


Rezultă că x = 280/20 = 14 m. 


Pentru distributii de frecvenţă în care intervalul de 
m folosi drept valoare a 


să exemplificăm 


clasă este mai mare decât 1, VO 
caracteristici valoarea centrală a clasei. 
cu datele din Tabelul 3.3: 
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il.1); 


Calcularea mediei ponderate 
(pentru intervalul de clasá mai mare ca 1) 


Tabel 3.3 


ERARI era aL] cm ARM 


Mai explicit: 


pas 1: am calculat valoarea centralà a clasei (vezi 


pas 2: am înmulţit valoarea centală (x) cu 
frecventa (f) corespunzátoare (coloana fx); 

pas3 : am adunat produsele obtinute (1612); 

pas 4: adunăm valorile din coloana frecventelor f. 
(76); 
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poue 


pas 5: aplicând formula de calcul a mediei 
ponderate am impártit suma produselor fx,la totalul 


frecventelor (76). 


ill. 1.3 Proprietatile mediei aritmetice 


Media aritmeticá are o serie de proprietăți, dintre 
care le menţionăm pe cele mai importante: 
1. mărimea mediei aritmetice este întotdeauna 


cuprinsă în intervalul de variație al valorilor individuale ale 


caracteristicii: 


x o dx ex 


“unde Xmin = valoarea cea mai mică din șir; 


Xmax = valoarea cea mai mare din şir. 


2. Suma algebrică a abaterilor termeni! 


la media lor este egală cu zero. 
În cazul unei serii simple aceasta înseamnă : 


.E(X- x) - 0, 
iar in cazul unei serii cu frecvență . 


(x, T x fi = 0. 


or seriei de 
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Mai explicit, considerând următorul sir 7, 13, 22, 9, 11, 4 


avem media egală cu 66/6 = 11. Deci: 


| 3. Suma pătratelor abaterilor dintre date și media 
aritmetică este mai mică decât suma abaterilor ridicate la 
pătrat în jurul oricărei alte valori în afară de media 
aritmetică. Folosind exemplul anterior se poate „uşor 


demonsira această proprietate: 


Dacă alegem o altă valoare decât media aritmetică (să 


zicem 4), suma abaterilor ridicate la pătrat va fi mai mare 


CE Scanned with OKEN Scanner 


38 


Lol 


decât 194: (7-4 + (13-4) + (22-4) + (9-4) + (11-4 + (4- 
4) = 488. este evidentă relația: 488 > 194. 

4. La seriiie de distribuţie de frecvență, media 
oscilează în jurul termenului cu frecvenţa cea mai mare. 


5. Într-un sr de valori egale, media acestora este 
egală cu fiecare dintre ele, indiferent dacă este o serie 
simplă sau cu frecvențe. Dacă avem șirul 3, 3, 3, 3, 3, 3, 
media aritmetică este 3, respectiv ca fiecare valoare a 


șirului dat. 


Câteva caracteristici ale mediei aritmetice: 

4 calculul mediei este simplu, 

/ există o singură medie aritmetică pentru un ansambiu 
dat de valori; 

/ media ia in considerare toate valorile ansamblului; 

4 trebuie să fie exprimată în aceleași unități de măsură ca 
şi valorile la care se referă (meiru, secundă, greutate, 
puncie, etc.). 

Dezavantaje: 


deoarzce ia în considerare toate vaicrile ansamblului 


devine sensibilă la valorile foarte mari sau foarte mici; 
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astfel media nu mai reflectă corect tendința centrală a 
distribuției; | 

ə media  "comprimá" excesiv valorile extreme, 
comparativ cu cele aflate mai spre- centrul distribuției; 
la distribuțiile simetrice această situație contează mai 


puţin, însă la cele puternic asimetrice acest lucru nu 
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III.1.4. Media aritmetică pentru mai multe şiruri 


Pentru două sau mai multe șiruri (k), media 
aritmetică se calculează prin împărțirea sumei produseior 
dintre fiecare medie şi numărul de cazuri din grup la 


numărul total de cazuri: 


n m 
3 
per i-l “iz 


= nx, tnjx^ 
x= PER d bal Mele îmi A 


mtn, E N 


ep NNE NC Is AD RIN e te 


(11.2 Media armonică simplă si ponderată 
lil.2.1. Media armonică simplă 


Media armonică este inversul mediei aritmetice a 


inversurilor valorilor a caror medie o căutăm. Este un tip 
de medie mai rar utilizată, dar care are aplicabilitate în 


comeniul educatiei fizic> Si sportului, mai ales pentru 


rezolvarea probiemelor legate de viteze. 

Să presupunem că într-o competiție aviatică se cere 
efectuarea unui raid aerian, fiecare avion având de 
parcurs un traseu de formă pătratică, cu laturile de 100 
km. Unul dintre concurenți parcurge cele 4 laturi ci: 


următoarele viteze: 100 km/h (a zburat cu vântul din faţă), 
a doua cu 200 km/h, a trsia cu 300 km/h şi ultima cu 400 
km/h. Ne întrebăm care a fost viteza medie a avionului? 


Recurgând la calculul mediei aritmetice avem: 


1004-200--300--400 1000 »sokm ! h 


4 "5. 
Este rezultatul corect? Să ne convingem rationànd 
în felul următor: 
- prima latură a fost parcursă într-o oră; 


- a doua in 30 de minute; 
- a treia in 20 de minute; 
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- ultima în 15 minute. 
În total 60 + 30 + 20 + 15 minute = 2 ore si 5 minute. Deci, 


viteza medie a fost in realitate alta. 
Formula mediei armonice este inversul madiel 


aritmetice a inversului valorilor: 


Xh = 


n 
1 
25 


În cazul avionului participant la raid avem, deci: 


+—— pa 
100 200 300 400 1200 


Media armonică ne dă răspunsul corect la problema 
noastră. Se observă că media armonică se aplică în acest 
caz deoarece duratele au fost diferite pe parcursul de 
lungimi egale. Dacă duratele ar fi fost identice şi 
parcursurile diferite, s-ar fi aplicat media aritmetică. 


11.2.2. Media armonică ponderată 


Media armonică ponderată se obține ps baza 
produselor dintre frecvențe și valorile inverse ale 
caracteristicii, astfel: 


CE Scanned with OKEN Scanner 


Media armonică calculată pe baza acestei relații, 
din valori pozitive, este întotdeauna mai mică decât media 


aritmetică. 


Iii.3. Mediana si mocuiul 


1.3.1. Mediana(M, 


Orice medie este reprezentativă peniru grupuri 
omogene de date. Există însă multe distribuții care desi 
sunt alcătuite din elemente omogene prezintă mari 
diferențe între valorile lor extreme, diferențe agravate de 
faptul că elementele lor au tendinta de a se concentra 
spre una din extreme. Astiel de distribuții sunt, într-un 
grad mai mare sau mai mic, asimetrice. Rezultă doar că, 
în astfel de cazuri, avem nevoie de o măsură a tendinței 
centrale care să nu fie influențată de valorile extreme. 


Mediana este o astfel de măsură a tendinței centrale. 
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Mediana este valoarea centrală a unei serii, 
ordonată crescător sau descrescător și care împarte 
termenii seriei în două părți egale: 50% din termeni 
(jumătate) sunt mai mici decât mediana și 50% sunt mai 
mari decât aceasta. 

Dacă seria de date este impară, mediana va fi acea 
valoare care corespunde celei de-a (N + 1)/2 observatii. 
Pentru seria 2, 7, 16, 19, 20, 25 și 27 (N = 7), mediana 
este a patra valoare, respectiv 19. 

Dacă seria are un număr par de date, mediana se 
calculează ca medie antmetică a celor două valori din 
mijlocul șirului. Să adugâm la seria anterioară valoarea 31 
(N = 8); mediana va fi media aritmetică dintre 19 și 20 (19 
+ 20)/2, deci 19,5. 

O situaţie mai aparte o constituie seriile mici 
(n<30), în care anumite valori apar de mai multe ori Si nu 
este necesară gruparea datelor în clase. De exemplu, șirul 
7, 7, 7, 8, 8, 8, 9, 9, 10, 10 (N=10) cu număr par de date. 
Care este mediana? În acest caz ea se obține prin 

interpolare, limitele exacte (vezi cap.ll.1) sint cuprinse 
între 7,5 şi 8,5 şi fiecare dintre cei trei de 8 ocupă o treime 


din interval (0,33). Deci mediana va fi 7,5 + 0,66 = 8,16. 
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În cazu unei distribuții de frecvențe găsirea 


medianei este ceva mal dificilă; 
o vom afla în interiorul acelei clase care contine valoarea 


centrală. 
Să considerăm datele din Tabelui 3.4, conținând 


numărul de puncte obținute de o grupă de elevi la un 


complex tehnico-tactic: 


„Distribuţia de frecvențe a punctelor obținute la complexul 
tehnico-tactic 


Formula de calcul a medianei este: 


astfel putem presupune că 
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cu următoarele semnificații: 
X; - limita inferioară a clasei care contine mediana. Având 76 
de observații (număr par) mediana va fi în clasa care conține 
a 38-a valoare. În cazul nostru a 38-a valoare este, conform 
frecvențelor cumulate în clasa 15-19, a cărei limită inferioară 
este 14,5; 
Xf, - numărul de cazuri (total 76); 
Xf. - suma cumulată a frecvenţelor din clasele ce se află 
înaintea celei în care se găsește mediana (13 în cazul 
nostru); 
fa - frecvenţa grupei în care se găsește mediana (26); 
K - intervalul de clasă (5). 


În final avem: 


M, =14,5 +| 326 ——— |x15-19,4 
26 


Ill.3.2 Modulul (M;) 
: Modulul (modul sau dominantă) reprezintă valoarea 
caracteristici cu frecvența cea mai mare. Desigur cà un 
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colectiv este mai bine caracterizat de o valoare 
inregistrată care apare de mai multe ori, decât de o alta 
care apare o singură dată. 
.. S considerăm următoarele observaţii: 11, 11, 12, 
42, 12, 13, 13, 13, 13, 13,14, 14, 14, 15, 15, 15, 16, 16, 
17, 18. Valoarea 13 apare de 5 ori, mai frecvent decât 
oricare altă valoare; deci, modulul este 13. 
În situația în care toate valorile apar cu aceeași 


frecvență sau nici una din valori nu se repetă, nu există 


modul. În urmăiorul set de observații: 2, 7, 16, 19, 20, 25, 
27 nu există modul. Nici în următoarea situație modulul nu 
poate fi determinat: 2, 2, 2, 7, 7, 7, 16, 16, 16, 19, 19, 19, 
20, 20, 20 - toate valorile apar de trei ori. | 

T in cazul in care două valori alăturate au aceeași 
frecventă, dar care este superioară frecvențelor de apariție 
a tuturor celorialte valori, modulul se obține din media 
aritmetică a valorilor alăturate. De exemplu în seria 11, 11, 
12, 12, 12, 13, 13, 13, 13, 14, 14, 14, 14, 15, 15, 16, 16, 
17, 18, valorile 13 si 14 apar de 4 ori, fiind totodată 
frecventa cea mai mare; modulul este deci (13 + 14)/2 = 
13,5. ut 
Când două valori nu sunt alăturate dar apar cu 


frecvențe mai mari decât cele din vecinătatea lor, atunci 
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oricare din aceste două valori poate fi modul: 11, 11, 12, 
12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 15, 15, 16, 
16, 16, 17, 17, 18. Valoarea 13 apare de 5 ori, mai 
frecvent decât 12 şi 14; valoarea 15 apare de 4 ori, de mai 
multe ori decât 14 și 16. Mai concret, măsurarea taliei unui 
eșantion de bărbaţi și de femei va duce la concentrarea 
valorilor obtinute la bărbați într-un alt punct decât cel al 


taliei femeilor. Avem de-a face in acest caz cu o distribuție 


de frecvență bimodală. În cazul distribuţiilor bi- sau 
plurimodale vom avea un mod principal si unul, respectiv 
mai multe moduri secundare. | 

În cazul distributilor cu clase de frecvențe se 
vorbeşte despre o clasă modală, respectiv clasa cu 
frecvenţa cea mai mare. Modulul se calculează cu ajutorul 
unei formule care ia în considerare atât clasa modală, cât 
și clasele vecine acesteia, formulă bazată pe principiul 


interpolării (vezi si mediana): 


| M l 
M, =X% + L— Ix K , unde 
A, id 2 
X, - limita inferioară a clasei care contine modulul, clasa cu 
cea mai mare frecvenţă (dacă există două asemenea grupe, 
- formula nu mai este valabilă); 


Aa - diferenţa dintre frecvența clasei modale și a clasei 
imediat următoare; 
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A, - diferenţa dintre frecvenţa clasei modale si frecvența 
grupei precedente; 
K - intervalul de clasă. 
Prin felul în care se determină, modulul nu posedă 


calități aritmetice bine definite si deci nu poate fi preluat în 
calculele ulterioare pentru determinarea unor caracteristici 


suplimentare ale distributiilor statistice (de frecvențe). 
Exerciţii 


1. Să se calculeze media aritmetică, mediana și modulul 
pentru următoarele date: 


ORF SPER 
» meri enim F v boio ct ESA ^43 qu Ws ra at) 
fa Iza, q9 IM va 3 i t 


- 


A te. 


2. Să se calculeze media aritmetică, mediana si modulul 
pentru urmátoarele date: 


Clase [h ZERG 
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CAPITOLUL IV 
PARAMETRII DISPERSIE! 


Prin calcularea mediei se urmărește găsirea unei 
expresii numerice sintetice, reprezeniativă pentru toate 
valorile individuale din care s-a calculat. Ea va fi cu atât 
mai reprezentativă cu cât valorile individuale sunt mai 
apropiate între ele. Ca urmare, folosirea mediei în 

vederea caracterizării a ceea ce este comun și tipic în 

formele individuale trebuie să fie precedată de verificarea 
gradului de reprezentativitate al acesteia pentru întrega 
masă de valori individuale. Aceasta presupune să se 
analizeze în ce măsură valorile individuale variază în jurul 
mediei. 

Dacă media este reprezentativă, semnificativă 
` pentru valonle din care s-a calculat, atunci colectivitatea 


este omogenă $i deci abaterea valorilor individuale de la 


medie poate fi explicată pe seama acţiunii factorilor 


întâmplători. În schimb, dacă variația in jurul mediei 
depăşeşte un anumit prag, înseamnă că cel puţin unul din 


factorii esentiali are 
colectivitatea pe mai multe tipuri calitative. 


influentă variabilă, structuránd | 
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Reprezentând datele grafic, cea mai simplă și mai 
eficientă indicație asupra împrăștierii valorilor în cadrul 
intervalului total de variație o oferă curba de distribuție a 
frecvențelor. Pentru exprimarea numerică a acestei 
împrăștieri se folosesc parametrii dispersiei. 

La determinarea acestor parametrii se pot lua în 
considerare valorile extreme, mediana sau media 


aritmetică. 


. N.1. Amplitudinea de variatie(A) 
Amplitudinea (A) se calculează ca diferenţă între 
valoarea maximă și valoarea minimă a caracteristicii și se 


exprimă în unitatea de măsură a acesteia: 


A = Xmax” Xmin 


Următoarea serie fO, 12, 15, 18, 20 are amplitudinea 
A=10 (obținută prin 20 -10). 


În cazul datelor grupate amplitudinea variației se 


“calculează ca diferenţa între limita superioară a {ului și 


limita inferioară a primului interval. 
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„Fiind calculată numai pe baza valorilor extreme 
amplitudinea nu este un indicator suficient de semnificativ 
pentru măsurarea variaţiei. Se folosește mai frecvent, în 
prelucrarea ` datelor, la alegerea numărului de grupe 


(clase) și a mărimii intervalului de grupare. 


IV.2. Cuartilele si abaterile cuartilice 


Dacà valoarea centrală este mediana, ` atunci 
dispersia poate fi exprimată sub forma abaterilor cuartile. 

Cuartilele (sau quartile) sunt parametrii analogi 
medianei, dar care împart șirul de valori in patru párti 
egale, fiecare incluzând 2596 din valorile șirului. Atunci 


când se dorește o analiză mai detaliată a modului cum 


sunt repartizate valorile în interiorul intervalului total de 


variaţie, şirul poate fi împărțit în mai mult de 4 părți egale. 
Valorile care delimitează aceste subșiruri sunt denumite 


generic cuantile (exemple de cuantile: mediana, cuartile, 


decile - impart sirul in 10 párti egale -, centile, etc.). 

De-a lungul unui șir ordonat crescător vom întâlni 
deci un număr de 3 cuartile, notate de regulă Qa Qi 
(coincide cu mediana) $i Qs. Astfel se pot calcula doi indici 


de dispersie: 
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a) abaterea cuartilică (intercuartilicá), care „reprezintă 
diferenta, în valoare absolută, dintre a trei și prima cuartilà 
(Q-Q,). Se obține astfel o imagine asupra dispersiei, 
comparând abaterea intercuartilicá cu amplitudinea (A); 

b) abterea semiintercuartilicà (Q) este definită ca fiind 

media probabilă a abaterilor de la mediană, cu alte 
cuvinte jumătate din modalitățile caracteristicii diferă 


de mediană prin mai mult decât această valoare, iar - 


cealaltă jumătate prin mai puțin: 
(9; pi Q;) 


Q= 


2 

Deşi prin măsurarea abaterii semiintercuartilice 
evităm influenta valorilor extreme, pierdem în același timp 
informaţiile oferite de valorile din primul și ultimul sfert al 
seriei; se neglijează astfel valorile situate sub prima 
cuartilă sau peste cea de-a treia, deci 50% din totalul 
valorilor seriei. Nu trebuie totuși să omitem faptul că ea se 
referă la abaterea datelor față de mediană și nu ne spune 
"nimic despre abatera datelor față de media aritmetică (se 
poate întâmpla ca valoarea mediei aritmetice să nu se afle 
între prima si a treia cuartilă). 

Sintetizarea variației unei caracteristici într-o 
singură expresie numerică se realizează prin valoarea 
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medie calculată pe baza abaterilor individuale ale 
variantelor de la media lor. 


IV.3. Abaterea medie(A,) 


Abaterea medie (absolută) se calculează ca o 
medie aritmetică simplă sau ponderată a tuturor abaterilor 
termenilor seriei de la media lor. Relaţiile de calcul sunt: 


Zk- 


(— wt 
pentru o serie simplá, 
$i 
ET 


Am = FI 
$ 
i=l 


pentru o serie cu frecvențe. 


sà considerăm următoarea serie: 


reuera ELE E [A E ARE 
1 4 7 10 313  totcumedia?. 


ELE e i simis TRI AS ICE Da A E AGAIN C ORA Pel 
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Pentru primul sir abaterea mediei este zero (7-7=0). 


Pentru cel de-al doilea avem: 


Deci, A,- 18/5 - 3, 6 și se exprimă în unităţile de măsură 
ale caracteristicii. 

* Se remarcă faptul că diferențele x- x pot lua valori pozitive 
(când valorile variabilei sunt mai mici decât media 
aritmetică, x<x) sau valori negative (în caz contrar, 
respectiv x>x). De aceea diferențele X-x se iau în 
valoare absolută (în modul) fapt care împiedică prelucrările 
statistice ulterioare. Acest aspect determină folosirea 
celorlalti indici statistici pentru caracterizarea dispersiei. 


IV.4. Dispersia (variaţia, o°) 


Cea mai bună si mai des folosită măsură a 
variabilităţii este dispersia sau rădăcina ei pătrată, abterea 
medie pătratică sau abaterea standard. 
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Ca şi media aritmetică, dispersia se notează cu 
două simboluri: 
a) o°, reprezentând dispersia unei populații; 
b) S?, dispersia unui eșantion. 
Dispersia se calculează ca medie aritmetică a 
pătratelor abaterilor termenilor față de media lor: 


Y -xy 


2 = izl 


o 


N 
pentru date negrupate, 
Și 
ad 2 
ps2 
2 _ i=l 


diu N 
$^ 
i3 c 


pentru o serie cu frecvente. 


Determinarea dispersiei presupune, după cum 
rezultă din formule, efectuarea următoarelor calcule: 


stabilirea abaterilor individuale (xex); | 
rilor individuale (dispar astfel 


. ridicarea la pătrat a abate 


 valorile negative); 
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e înmulţirea pătratelor abaterilor cu frecvențele de apritie 
(numai în cazul dispersiei calculată pentru o serie cu 
frecvențe), | 

e însumarea pătratelor abaterilor (multiplicate cu 
frecvențele); 

ə raportarea totalului la numărul total de unităţi (cazuri) 
înregistrate. | 

Considerând seria ll de la punctul anterior (IV.3), să 


exemplificăm (x = 7): 


Dacá sirul ar fi fost mult mai mare atunci impártirea 
s-ar fi fácut la N. Ín cazul nostru, al unui esantion, corect 
este: | | 


“Expresia n-1 este numită “grade de libertate". Ea 
semnifică numărul vaorilor independente care sînt 
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necesare pentru determinarea divizorului. După cum știm 
(vezi proprietăţile mediei aritmetice, cap.lll.1.3. suma 
abaterilor de la media aritmetică este întotdeauna egală 
cu zero. Presupunánd cá, din cele cinci observatii de mai 
înainte, le cunoaștem doar pe primele patru (-6, -3, 0, 3), 
cea de-a cincea abatere de la media aritmetică trebuie să 
fie neapărat 6 pentru ca suma abaterilor de la media 
aritmetică să fie egală cu zero. Rezultă că numai patru din 


cele cinci observaţii sînt independente și deci le putem 


considera ca fiind grade de libertate, pe când cea de-a 
cincea observaţie este în mod necesar determinată de 
valorile primelor patru. Dacă am mai avea încă un 
eșantion cu n=1000 de valori, împărțirea sumei pătratelor 
abaterilor individuale la 1000 sau la 999 (1 000-1) va da 
cam același rezultat, pe când împărțirea prin 5 (a unei 
sume de 90, de exemplu) sau prin 4 va da rezultate foarte 
diferite (18 în loc de 22,5). Pentru a simplifica lucrurile, în 
toate cazurile se folosește n-1 indiferent de mărimea 


eșantionului. 


IV.5. Abaterea standard (abaterea medie pătratică) 


Abaterea standard (medie patraticá, deviatie 
standard, abatere tip) se calculează ca o medie pátraticá 
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din abaterile valorilor individuale de la media lor aritmetică 
sau, cu alte cuvinte, extrăgând rădăcina patrată din 
dispersie (o^). 

Formulele de calcul sînt: 


pentru datele negrupate referitoare la întreaga populație, 
respectiv pentru un eșantion (S) 


pentru o serie cu frecvenţe. 


- Abaterea medie pătratică se exprimă în unităţile de 
măsură ale caracteristicii si este mai mare decât cea 
medie deoarece prin ridicare la pătrat se acordă o 
importanță mai mare abaterilor mai mari.Ca urmare, cele 
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două abateri (medie, standard) nu pot fi folosite pentru 
compararea gradului de variație a unor caracteristici 
exprimate în unități de măsură diferite. În acest caz este 
necesar să se calculeze un indicator deosebit de preţios - 

Jficientul de variabilitate (de variaţie) - care reprezintă 


coencieruu us vc EM 


exprimarea procentuală a câtului dintre abaterea standard 
şi media aritmetică: | 


y -Sx100 


x 


Principala. calitate a coeficientului de variabilitate 
constă în aceea că face posibilă compararea colectivelor 
măsurate cu unități de măsură diferite (secunde cu metri, 
de exemplu) sau a diferitelor colective măsurate cu 


aceeași probă (sau probe diferite). 


Cu cât coeficientul de variaţie se apropie mai mult 


de zero, cu atât variaţia este mai mică şi colectivitatea mai 


omogenă, respectiv media mai reprezentativă. În schimb, 


cu cât coeficientul de variabilitate este mai mare cu atât 
variația este mai intensă, iar gradul de semnificație al 


mediei este mai scăzut. 
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Statistica recomandă pentru interpretare 
următoarele trepte de apreciere: 
e 0- 10%, omogenitate mare; 
e 10-20%, omogenitate medie; 
e peste 20%, lipsă de omogenitate. 
Agoston (citat de St. Tudós, p.33) propune (pentru 
procesul instructiv-educativ) următoarea scară de variaţie: 
e 0- 15%, împrăștiere mică; 
e 15-25%, împrăștiere moderată; 
25 -35%, împrăștiere mare; 
e peste 35%, împrăștiere excesivă. 


Aceste valori sunt influentate de numărul de cazuri 
si de amplitudine, găsind o variație mai mare la un număr 
mare de cazuri Si la probele ce permit obținerea de 
rezulate mult diferite. 


Exercițiu 


Să se calculeze abaterea standard S pentru următoarele 
Şiruri de date; 


- "BE tu ` 
2. iz: Ls 4 Pee ee mm que m eon A 
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DISTRIBUTIA NORMALÁ 


Va Distribuţia (curba) normală și caracteristicile sale 


Unul din scopurile prelucrării datelor de observaţii 
sub formă de distribuții de frecvențe este acela de a face 
comparații între distribuția (și curba aferentă) empirică si 
una teoretică, fixată ca model de referință. Similitudinea de 
formă a celor două tipuri de curbe (empirică Si teoretică) 
este foarte importantă, cáci ea oferă niște posibilități de 
analiză statistică complexă și aprofundată în urma căreia 
se pot trage multe concluzii de ordin științific. La originea 


multor astfel de analize se află tocmai curba normală, cu 


proprietăţile sale. 


| aga?). „Mergând mai departe, dacă se aruncă două 


T am 


Principiul curbei normale se bazeazá pe 
probabilitatea de apariție a unui eveniment atunci când 
acesta depinde de şansă. De exemplu, când arbitrul “dă 


. cu banul” pentru alegerea terenului de joc, şansa de a 
. obtine stema (să zicem) este una din două, aceeaşi cu cea 


de a “cădea” banul (moneda nu are decât două fete, nu-i 
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monede (sau o aceeași monedă de două ori) sunt patru 
posibilități, după cum urmează: 


a b a b a b a b 
MENS RP IE RUM EN 
unde S-stema, B-banul 
Așadar, șansa de a ieși stema de două ori este una din 


patru (0,25 sau 25%) - la fel si pentru ban; de a cădea 


Stema sau banul este una din două (0,5 sau 50%). 


Continuánd rationamentul vom vedea este doar o 
șansă din opt (2?) să cadă stema de trei ori la rând atunci 
când aruncăm trei monede, si o șansă din 1024 (2?) când 
aruncâm 10 monede. Dacă am plasa punctele 
corespuzătoare sanselor de a obține stema sau banul (la 
un număr cât mai mare de aruncări ale monezii) pe un 
sistem de axe ortogonale Și le-am uni apoi între ele ar 
rezulta curba: normală (în care șansele de obtine numai 
stema sau numai banul ar fi plasate la extremități şi stema 
sau banul spre centru) definită de relația matematică 
proprie (pe care nu o prezentăm). 

Această teorie a distribuţiei normale, aplicată la 
șansa de apariție a stemei sau banului are aplicabilitate și 
în domeniul socio-uman. Erediatea, mediul bio-psiho- 
social, starea de antrenament, sunt factori de care depind 
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numeroase atribute umane, șansa jucând de foarte multe 
ori un rol deosebit de important. 

Grafic, distribuția normală se prezintă ca o curbă 
normală. Curba normală reprezintă de fapt o distribuţie de 
frecvență în care cele mai multe frecvențe sunt 
concentrate în centrul ei, iar pe măsură ce se depărtează 
de centru devin, simetric, tot mai puține, apropiindu-se 
asimptotic de zero, ceea ce înseamnă că ea nu atinge 
niciodată axa orizontală sau abscisa. Curba normală este 
simetrică si are forma unui clopot (clopotul lui Gauss). Ea 
este împărţită în două părți egale de media aritmetică a 
frecvențelor pe care le reprezintă grafic; aceasta 
înseamnă că media aritmetică a curbei normale este egală 
cu zero (media aritmetică devine originea sistemului de 
axe). 

În cazul curbei normale, media, mediana și modulul 
sunt identice. Dat fiind că suma frecvenţelor este egală cu 
1, rezultă că si suprafaţa totală aflată sub curba normală 
este egală cu 1 (există tabele ale suprafeţei curbei 
normale care arată valoarea proportiilor acestor suprafete 
_ vezi tabel 5.1). În figura 5.1. prezentăm o curbă normală 
cu o medie aritineticá egală cu zero si suprafata de sub ea 


egală cu unitatea, având două puncte de inflexiune: 
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Figura 5.1 - Curba normală cu cele două puncte de inflexiune 


Se disting două puncte de inflexiune, simetric amplasate, 
unul în dreapta si celălalt în stânga mediei. În matematică 
punctul de inflexiune este definit ca punctul care isi 
schimbă alura de la convexitate la concavitate și invers. 
Dacă o distribuție poate fi privită ca normală, atunci 
distanţa dintre medie și punctul de inflexiune din dreapta 
mediei acoperă 0,3413 din suprafaţa totală de sub curba 
normală și este egală cu +10 după cum se vede în figura 
de mai sus. Curba normală fiind simetrică, rezultă cà 
0,3413 din suprafaţa ei situată la stânga mediei aritmetice 
este egală cu -1c. Deci, o proporiie de 68,26% din 


suprafața totală de sub curba normală este inclusă la o 


distanță de plus sau minus o abatere standard faţă de 
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media aritmetică (sau, cu alte cuvinte, aproximativ două 
treimi din suprafața totală este inclusă în acest interval de 
+10). Aceasta este distanţa dintre cele două puncte de 
inflexiune. 

Dacá másurám douá abateri standard de o parte și 
de alta a mediei, atunci se includ 95, 46% din suprafața de 
sub curba normală, iar dacă măsurăm trei abateri standard 
de fiecare parte a mediei, includem 99,72 procente din 
suprafata totală. Suprafețele de sub curba normală se 


găsesc în tabele special întocmite pentru o utilizare rapidă 


Vezi (tabelul 5.1 si figura 5.2). 


` c -——— am — um a ae y w 


de abateri standard 


Figura 5.2 Curba normală cu unități 
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De exemplu, dacă vom câuta pe coloana Z 
valoarea 1,0 (deci 1c) vom găsi pe coloana următoare 
(,00) valoarea 3413, adică 34,13% din suprafața de sub 
curba normală luată la dreapta mediei; la fel, pentru 26 
vom găsi la 2,0 pe coloana (,00) alăturată valoarea 4773 
(47,73% x 2 =95,46%), iar pentru 30 - 49,86%, respectiv 
99,72% din suprafața de sub curbă luată de o parte Si de 
alta a mediei aritmetice (49,86% x 2). 

Dacă distribuţia empirică aproximează o distribuție 
normală, abaterea standard devine un instrument de 
măsură deosebit de important (vezi capitolul VI). 

Desigur, multe din distribuțiile cu care avem de-a 
face în realitate, nu aproximează o distribuție normală. Dar 
însemnătatea fundamentală a distributiei normale în 
statistică si, în consecinţă si a abaterii standard, rezultă din 
faptul că chiar dacă populațiile nu prezintă caracteristicile 
unei distribuții normale, variabilele  eșantioanelor 
respective tind să fie distribuite normal. Aceasta este o 
lege cunoscută sub numele de teorema limitei centrale. 
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| Iberi 


Suprafete sub curba normalá 
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| v2. Parametrii formei 


Acești parametrii se referă în primul rând la forma 
curbelor (poligoanelor) frecvențelor. Media aritmetică, 


mediana si modului sunt identice numai în cazul unei 
distribuții perfect simetrice. Pe măsură ce o distribuţie 
- devine mai asimetrică valorile mediei aritmetice, a 
medianei și a modulului tind să fie divergente. | 


- V2.1. Indici de asimetrie 


Indicii de asimetne exprimă numeric măsura în care 
maximul de frecvență al unei distribuții este deplasat spre 
stânga, sau spre dreapta, fată de centrul intervalului de 

variație ai caracteristicii. 

În cazul unei distribuții moderat asimetrice există o 
relație aproximativă între mediană, modul si medie. Într-un 

asemenea caz, mediana se află la o treime a distanţei 
„între media aritmetică și modul, sau altfel exprimat: 


Mo = x- 3( x-Me). 
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Deoarece media aritmetică tinde să fie împinsă în ' 


direcţia valorilor extreme ale “cozii” celei mai lungi a unei 
distribuții, asimetria | poate fi măsurată prin mai multi 
coeficienţi din a căror multitudine prezentăm aici doar doi: 
1) coeficientul lui Pearson, se calculează pentru 
distribuțiile de frecvenţe când ia în considerare modului: 


(x- M.) 


Ca = es 


“în funcţie de raporturile de mărime dintre medie si modul 
coeficientul poate fi: | 
a) negativ (asimetrie negativă sau de dreapta) - x <Mo - 
A (numárátorul din formulă este mai mic ca zero), ceea 
ce înseamnă că maximul de frecvenţă este deplasat 
spre dreapta faţă de centrul intervalului de variație; 
b) nul (asimetrie nulă), curba de distribuţie este perfect 
simetrică; 
c) pozitiv (asimetrie pozitivă sau de stânga) - x»Mo - 
- modulul este plasat la stânga față de medie şi față de 
centrul intevalului în cadrul intervalului de variație. 


2) coeficientul lui Fisher (y.) care ia în considerare 


cubul abaterilor valorilor de la media lor aritmetică și a 
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cărui interpretare, în ceea ce privește asimetria, se 


“realizează la fel că în cazul coeficientului lui Pearson: 


(s -a) 


T1 3 , 
no 


pentru Şiruri de valori individuale și 


Xs -3)7 


izl 


pentru distribuția pe clase de frecvente 


V.2.2 Indicii de aplatizare (de exces) 


Acesti indici (coeficienti) exprimá numeric gradul de 
aplatizare a curbei de distributie, aplatizare ce depinde de 
apropierea maximului de frecvență; cu alte cuvinte, 
aceastá aplatizare depinde de diferenta dintre frecventa 
clasei modale si cea a claselor din apropiere (cu cât 


. diferența este mai netă, cu atât curba va fi mai ascuțită, si 


invers). 
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Pentru măsurarea asimetriei de aplatizare (de 
exces) cel mai des utilizat este coeficientul y, al lui Fisher: 


6-2 


— — ám 


yit 
2 no^ 


pentru șiruri de valori individuale Si 


Dh- 


I=: 


ra Xmas T FT, 
G^» y 
il 


pentru distribuția pe clase de frecvențe. 


Acest indice poate fi: 
a) negativ - y, < O - curba fiind mai aplatizată decât una 
normală (sau platikurtică); 
b) nul- y; =0- curba este una de tip normal. 
c) pozitiv - y> 0 - curba prezintă o boltire excesivă, mai 
ascuţită decât cea normală (leptokurtică). 


AJ, 
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Exerciţii: 


1. Se aruncă o monedă de patru ori (sau patru monede în 
acelaşi timp). Care este probabilitatea de a obiine: 
ay secvenţa B S B s?; 
b) de patru ori stema?; 
c) de trei ori banul ? 


Răspunsuri 


1. a - 1/16; 
b - 1/16; 
c - 1/4. 
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CAPITOLUL Vi 
VARIABII.ELE NORMATE 


(ETALONAREA) 


Etalonarea este acțiunea de transformare a datelor 
intiale în așa fel încât să devină posibile comparatiile între 
două sau mai multe distribuții empirice, sau între o 
distribuție empirică și una teoretică, idiferent de ordinul de 
mărime, dispersie sau unități de măsură. Adesea, în 
investigarea aceluiași fenomen, suntem puși în situația de 
a compara rezultatele individuale din două distribuții de 
valori ale variabilei obținute pnn măsurări succesive ale 
aceluiași colectiv sau de a compara două colective diferite 
prin rezultatele înregistrate în urma unei singure măsurări. 
in urma recoltării datelor. profesorul (antrenorul) 
alcătuiește un clasament la fiecare probă și constată că un 
subiect se clasează la o probă pe locul 7, la altă probă pe 
locul 5 și la alta pe primul loc. Această situaţie se aplică şi 


la celelalte unităţi ale colectivului rezultând faptul că este 


necesar ca fiecare subiect să fie apreciat în contextul 


colectivului din care face parte prin prisma performanţelor 


CE Scanned with OKEN Scanner 


75 


realizate. Făcând suma locurilor din clasament (5+7+1) se 
obţine un clasament al membrilor colectivului testat cu mai 
multe probe, dar se pierde aspectul calitativ, dat de 
obtinerea unei performante de exceptie la una dintre 
probe. Asa incát este necesar să identificăm modalităţi de 
stabilire a unor criterii care să surprindă atât latura 
cantitativă cât și pe cea calitativă. 

Metodele statistice intervin în rezolvarea acestei 
probleme prin procedeele de transformare a valoriior brute 


aie variabilei în variabile normate ce reprezintă unități ce 


pot exprima poziția unui subiect într-o distribuţie dată, atât 
în raport cu valorile centrale (media aritmetică) cât și cu 
cele ale dispersiei (abaterea standard). 

Se cunosc mai multe tipuri de variabile normate, 
noi prezentându-le doar pe cele mai utilizate, respectiv 


variabilele Z, T și H. 


VI.1. Variabilele Z 


Pentru a exprima mărimile unei distribuții luate în 
considerare prin măsuri Z, se împarte diferenţa dintre 
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oricare din acele mărimi și media aritmetică a distribuției 
prin abaterea standard. În cazul unei populații avem: 


? = 
+ y 


O 
iar în cazul unui eșantion 


x-x 
2 = 
$ 


In scările variabilelor standard Z, media aritmetică 
se reduce la valoarea zero, iar abaterea standard la 
valoarea 1 (6=1). | 

să presupunem că un student a obținut la un 
colocviu de Teoria educaţiei fizice si sportului nota 7, la 
care întreaga grupă a obținut în medie nota 5 cu o abatere 
standard egală cu 1 și la alt colocviu, de Metodica 
educaţiei fizice, nota 9, colegii săi obținând în medie nota 
6, cu o abatere standard de 2 (considerând că variabilele 
sunt distribuite normal, putem spune că 68,26% dinire 
aceştia au obținut note între 4 şi 8, o+2). La prima vedere 
sîntem tentaţi să afirmăm că studentul nostru a obținut o 


notă mai bună la Metodică decât la Teoria educaţiei fizice; 


dacă măsurăm însă aceste performanțe cu măsuri 


CE Scanned with OKEN Scanner 


| 
| 
| 
| 


77 


| standard, nota lui la al cel de-al doilea colocviu este de 


1,5 másuri standard peste medie, in timp ce la primul este 


de două măsuri standard peste medie: 
Colocviu de Teoria educatiei fizice - 


Sau, alt exemplu (Dragnea A., p.33), o variabilă care 
exprimă numărul de centimetri realizați la sáritura in 
lungime de pe loc de un subiect care a realizat 
performanța de 224 cm, ceilalți membrii ai colectivului 
sărind în medie 217 cm cu o abatere standard de 12 cm. 
Vom avea: 
, 24-27 _7 
12 12 
Valoarea obtinutà fiind pozitivă, rezultă cá ea se situează 
în dreapta mediei, într-o abatere standard spre dreapta. 
Revenind la tabelui 5.1 (vezi capitolul anterior) valorii 
pozitive 0,58 îi corespunde un procent de 21,9% din 
cazuri. Dacă luăm altă performanță, 204 cm de exemplu. 
rezultă: AR 


= 0,58 
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deci o valoare negativă, situată în stânga mediei pe curba 


lui Gauss. 
Variabilele nomate pe scara Z sunt deseori 


incomode prin apariția semnului “.” (minus) (când media 
este mai mare decât valoarea individuală luată în calcul, 


x»X) şi a valorilor zecimale. Aceste neajunsuri sunt 
eliminate prin utilizarea variabilelor normate T (introdusă 


de McCall) și H (propusă de Hull). 


VI.2. Variabilele T 


Scara propusă de McCall are o distribuţie cu media 
x —50 si o=10, iar variabilele T se obțin utilizând relația: 
| 10 
T-2504—lx-x* 
6-2) 
Propriu-zis, pe această scară fiecare unitate T este 
egală cu o zecime dintr-o unitate o. 
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— V1.3. Variabilele H 


Datorită faptului că o distribuție depășește foarte rar 
intervalul +3,50, Hull a introdus o altă scară de variabile 
normate care apelează tot la media x =50, dar 6=14, 


relația de calcul a variabilelor H fiind: 
Ape += 
H = 50+—(x—x 
Folosindu-ne de exemplele de la variabilele Z 
(săritura în lungime, cu performanţele X,=224 cm, X,-204 


cm, media 217 cm si abaterea standard 12 cm), să facem 


o comparaţie între cele trei scări: 


Se remarcă faptul că este destul de dificil să 
caracterizezi diferenţa între performanțele stadardizate ale 
celor doi subiecti (X, și X2) recurgând la variabila Z, fiind 
mai ușoară comparatia utilizând scările introduse de 
McCall si Hull. 

Utilizând una din scările prezentate, aceasta se 
aplică la toate probele la care sunt supuși subiecții, 


da, 7 : 
esie mai 


sumându-se apoi punctele realizate. În acest fel 
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ușor de alcătuit un clasament, deoarece avem situația 
fiecărui subiect în contextul respectiv sau, cu alte cuvinte, 
măsurăm toate performanțele cu un etalon unic. 


Exercifiu: 


Să se calculeze scorurile standard pentru urmátorul sir de 
date, reprezentând notele obținute de o clasă de elevi la 
trecerea unei probe de control: 


m —— e ai 


JE m med 


În mom mm mpeg = = e 


MÀ —À —— 


p—Ü—À 
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CAPITOLUL VII 
CORELATIA STATISTICĂ 


De multe ori, specialiștii din domeniul educaţiei 
fizice şi al antrenamentului sporiiv se întreabă în ce 
măsură exercţiile preconizate sau folosite în pregătirea 
sportivilor influențează randamentul acestora în probele 
de concurs; și invers, cei care obțin rezultate bune în 
probele de concurs obțin, în aceeași măsură, rezultate și la 
exerciţiile pregătitoare? 

Pentru rezolvarea unor asemenea probleme este 
necesară cunoașterea măsurii, a gradului de dependentă a 
fenomenelor, mai exact a posibilității în care existența unei 
variabile o determină pe cealaltă. Metodele statistice 
intervin în analiza cantitativă și calitativă a legăturilor dintre 
fenomene prin tehnicile de corelaţie. În cercetările curente 
ne interesează în special relaţii de tipul: 

a) cauză - efect, când variaţia fenomenului A determină 
variația fenomenului B, între ele stabilindu-se legături 


funcţionale; 
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b) paralel independente, când fenomenele A si B sint 
condiționate de fenomenul C, între primele două 
variația fiind independentă; 

C) relaţii independente, când fenomenul A variază 
independent de fenomenul B. 


La toate acestea găsim rezolvarea prin înțelegerea 
sensului corelatiei si prin calcularea coeficienţilor de 
corelație. 


VII.1. Coeficientul de corelaţie și de determinare 


VII.1.1 Coeficientul de corelatie 


Prin corelaţie se înțelege procedeul statistic prin 
care se stabilește raportul de dependență dintre două 
fenomene. 

În funcţie de direcția de variație a fenomenelor, 
corelatia poate fi pozitivă dacă variația este concomitentă 
directă (creșterea variabilei determinante x duce la 
creșterea variabilei determinate y) sau negativă, dacă 
variaţia este concomitentă indirectă (creștera variabilei x 
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determină descresterea variabilei y). În cercetarea relaţiei 
dintre fenomene este necesar să se stabilească gradul de 
corelație, respectiv măsura în care creşterea variabilei x 
determină crestera sau descreșterea variabilei y, sensul 
corelatiei (pozitivă, negativă sau nulă) Si natura sa, 
respectiv dacă fenomenele sînt în relație cauzală sau în 
relații de independenţă. ambele fiind condiționată de un ai 
treilea fenomen. Gradul și sensul corelatiei se stabilesc 
prin intermediul coeficienţilor de corelație, iar natura 
corelatiei rezultă din analiza și interpretarea fenomenelor 
cercetate. Dar să exemplificăm, pentru a înțelege mai bine 
afirmatiile de până acum. ! 

să începem cu un exemplu de corelaţie (pozitivă) 
perfectă (reprezentată în figura 7.1), extrem de rar sau de 
loc întâlnită în practica domeniului nostru si a ştiinţelor 
educatiei, pornind de la numărul de puncte obținute de 10 


subiecti la două teste X și Y: 


ai e se aman ea 


; icr au. tă că 2 - 
Test Y 4 6 7 10 11 


Se observá usor cà fiecare subiect a obtinut la al 
doilea test (Y) cu 2 puncte mai mult decât la primul test, 
fárá nici o excepție. 
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Figura 7.1 


O corelaţie pozitivă puternică (ridicată) se obţine 


atunci când la două teste diferite X si Y, în general, o 
persoană (subiect) care obține un punctaj bun la testul X 
obţine un scor bun şi la cel de-al doilea (Y). Sá 


considerăm următoarele date: 


at ax ai pi dr 43 1CSAETVRARXICNESASEEZAQEENDSMEKOAIREQAL RAE ri pUE PIA AA SCIL VI a aa ep ibas ie ey 
TostM iO ri sab erc D R ORE ORITUR 
` zi M e aAA db RE E a T up iE mt erre pai a o Ar ond. RAF Adeo emo p rare, 


Test Y 18 4. 11.9 


i - 
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şi să le reprezentăm grafic în figura T. 

Am recurs la reprezentările grafice în cele două 
figuri pentru a putea remarca diferențele apărute. Astfel, în 
figura 7.1 punctele sunt coliniare și așezate pe o dreptă 
ascendentă (spre dreapta, în unghi de 45%) conform 
valorilor, pe când în figura 7.2 ele sunt ușor împrăștiate. 
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Un al treilea exemplu îl constituie o corelație 
pozitivă scăzută (figura 7.3). De această dată un subiect 
care a obținut un punctaj bun la primul test, a obținut la ce! 
de-al doilea un număr de puncte la fel cu un subiect mai 
Slab cotat inițial. Vom vedea că împrăștierea punctelor 


este mai mare decât la corelatia puternică (pozitivă): 


Su 
TAI 


biectul 
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Ultimul exemplu se referă la cazul unei corelaţii 
negative semnificative (remarcabile). Comparând figura 
74 cu celelalte vom remarca faptul că punctele de pe 
grafic sunt grupate (dar descendent, spre dreapta), ceea 
ce arată cà un subiect care a obținut un punctaj bun la 


primul test a obținut rezultate slabe la cel de-al doilea: 


Test Y 11 13 


CE Scanned with OKEN Scanner 


» 38 


Gradul si sensul legăturii dintre fenomene se 
exprimă printr-un indice statistic numit cosficienf de 


corelatie. Pentru determinarea coeficientilor de corelatie, 


statistica matematicá pune la dispozitia cercetătorilor 


diferite tipuri de metode: metode analitice (parameirice) ce 
^ seama de valorile variabilei Si de parametrii curbelor de 
uustributie (media aritmetică şi abaterea standard) $i 
metode neparametrice, care utilizează simboluri sau 
numere de ordine (ranguri), oferind posibilitatea măsurării 
intensității legăturilor atât pentru caracteristici cantitative 
cât și pentru cele calitative. 

Dintre metodele parametrice ne vom limita la cea 
propusă de Pearson, cunoscută si sub numele de metoda 
produselor. Coeficientul de corelaţie r calculat prin 
_ metoda lui Pearson are la bază deviatiile valorilor 
variabilelor de la media aritmetică și abaterile standard ale 
celor două distribuții si se determină după relația 


matematică: 


XC E ME -y) | 
h8,8,. ^. 


r= 


sau 


CE Scanned with OKEN Scanner 


unde - x, y, sînt valorile celor două variabile; 
TX.y mediile aritmetice; 
- &, S, abaterile standard aie celor 
două distribuții; 
- n reprezentând numărul de cazuri 


| Notànd cu d,x-x Si di-ycy deviaţiile valorilor 
variabilelor de la media aritmetică, formula devine: 


n 


2/44, 


izl 
24:2 4, 


Să exemplificăm folosind rezultatele obținute de un 


r= 


eşantion de 10 elevi la două teste X (x -44) si Y (y=44): 


2 € D m e e m n mapa mate rame T 


33 
36 
39 


42 
45 
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O metodă neparametrică este corelatia rangurilor. 
Ea se bazează pe înlocuirea valorilor empirice ale 


Utilizând ultima formulă obținem r = 


variabilelor prin rangurile respective, adică prin locul ce-l 
ocupă în ordinea lor crescătoare sau descrescătoare. 
Corelaţia rangurilor poate fi aplicată și pentru calcuiarea 
gradului dependenței dintre fenomene şi caracteristici 
calitative care, prin definiţie, nu pot fi exprimate numeric, 
dar care sînt totuși susceptibile de a fi ordonate într-o 
anumită ierarhie, în cadrul căreia ocupă un anumit rang. 
Pomim deci de la ipoteza că între rangurile celor două 
variabile există o dependenţă a cărei intensitate dorim să o 
calculăm. 
Formula lui Spearman ia în considerație suma 
pătratelor diferenţelor dintre fiecare pereche de ranguri: 
6» d? 6» d` 
ur c D 2 
Să luăm de exemplu două șiruri de variabile care 
reprezintă performanţele obținute de un grup de subiecți la 
arucarea mingii medicinale de 2 kg cu ambele mâini, 


înainte și înapoi (Dragnea A., p.40): 
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Pe baza valorii calculate. putem aprecia că între 
cele două șiruri de variabile există un înalt grad de legătură 
deoarece coeficientul este pozitiv, adică 0,931. 


Tehnica de lucru, în ordinea operațiilor, esie 


următoarea: | TENA 
a) se stabilesc rangurile (locurile de ordine) la fiecare sir 


in parte; in situatia in care avem mai multe variabiie 
. de aceeași valoare se însumează locurile de ordine și 
rezultatul se imparte la numárul de variabile cárora le- 
au fost atribuite (se face media lor aritmeticá). De 
exemplu: la testui X valoarea 15 se repetà de trei ori Si 
se cuvine să acordăm celor trei variabile locurile 3, 4 și 
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5 (mai mare ca 15 sint 17 si 16) dar nu putem, 
deoarece performanța este aceeași: 15m. Atunci 
calculàm media aritmetică 3-+4-+5=12/3=4 si vom da 
fiecăruia locul 4; în continuare acordăm locurile 
corespunzător performantelor. La fel se procedează și 
pentru testul Y; 

b) se calculează diferentele (d) dintre iocurile de ordine 
(RR); 

c) se ridică la pătrat (d?) diferenţele obținute, operaţie prin 
care dispar valorile negative și se face suma lor. 


înlocuind în formulă se obține: 


r-l _6x195 7117210068 = 40931 


T 12(144-1) 1716 


Atentie! La corelatie nu se ordonează datele! 


O altă metodă neparametrică este cea a contigentei 
(propusă de Pearson) care permite stabilirea gradului de 
legătură între două variabile calitative ce nu pot fi 
cuantificate (numeric) sau dintre o variabilă cantitativă și 
una calitativă. Formula de calcul a coeficientului de 


contingentá este : 
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: în Lf. 
| 1497 


unde $^ este un factor dependent de frecventele celor 
două variabile si de frecvențele combinațiilor dintre 


categorii și se determină după relația: 


să exemplificăm (după Gugiuman Ana şi colab, 
p.159-160) printr-o testare ce urmărește să stabilească 
dacă există o legătură între calificativele obținute de 
studenţii de la educaţie fizică la practica de specialitate și 
notele de la examenul de Metodica educaţiei fizice. Cum 
prima variabilă nu poate fi cuantificată, vom apela la 
aprecierea ei calitativă, în categoriile: slab, mediocru, bun 
si foarte bun. Aceleași calități le atribuim şi notelor: slab 
(până la 5,50), mediocru (între 5.50 si 7,00), bun (între 
7,00 si 8,50) si foarte bun (peste 8,50). Mentionám cà 
metoda este valabilă pentru oricâte categorii atribuite 
variabilelor, indiferent dacă numărul acestora este egal 


sau inegal pentru cele două variabile. 


GBA TENE YR COUR mr au m 
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Etapa următoare constă în alcătuirea tabelului de 


frecvențe: 


Pe ultima coloană apar frecvențele cumulate ale variabilei 
evaluare practică (f), iar pe ultima linie frecventele 
cumulate pentru evaluarea teoretică f, (6 pentru slab, 11 
pentru mediocru, 11 pentru bun si 7 pentru foarte bun). 
Combinatiile acestor frecvenţe (f) apar la intersectiile 
liniilor cu coloanele tabelului (f; = 2, frecventa 
corespunzătoare unei evaluări practice slabe Si teoretice 
tot slabe; f, = 3, respectiv practic - mediocru și teoretic 


slab, s.a.m.d). Astfel, cu aceste date, avem: 


— + : 
6 Alatke std 
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valoarea contingentei va fi 


078 66 
1-- 0,78 


C = 


Valoarea obținută de 0,66 ne arată cà există o legáturá 
semnificativă între cele două evaluări. 

Semnificatia statistică a unui coeficient de corelație 
(ce ne informează despre gradul și sensul legăturii dintre 
variabile) exprimă riscul de eroare, mai exact șansa ca 
indicele respectiv să se obţină exclusiv datorită hazardului. 
Valorile coeficientului r se pot aprecia și intuitiv direct: 


i +0,20 denotă o corelaţie indiferentă 


- valorile între 0 s 
intre variabile; 


- valorile între +0,20 si 30,40 denotá o corelatie 
scăzută; 


- între +0,40 si +0,70 se vorbește de cele mai multe ori 
de o corelaţie semnificativă (remarcabilă); 


- în intervalul +0,70 si +1 corelaţia este ridicată, foarte 
ternică si semnificativă. 


dacă acestea sunt 


Începând de la corelatiile semnificative, 
pozitive, atunci legătura dintre fenomene este directă 
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(cresterea unei variabile implicá o crestere a-celeilalte), iar 

dacă valoarea este negativă relația dintre fenomene este 

inversă (dacă o variabilă crește, cealaltă descrește). 

Referitor la natura legăturii, în cazul unui coeficient 
de corelaţie semnificativ, aceasta rămâne la aprecierea 
cercetătorului, în funcţie de variabile si de demersul 
stiintific in studiu. | 

in domeniul educatiei fizice si sportului, unde se 
prelucreazá date ale organismului uman, deci valori 
determinate bio-psiho-social, supuse unui mare număr de 
factori  întâmplători, se  considerá ca semnificativi 
coeficienţii pozitivi de la +0,70 în sus, spre +1. 

Factori care influențează coeficienţii de corelaţie: 

e esantionul ales să fie reprezentativ pentru populatia de 
referință; 

e  eșantionul să respecte condiţiile de omogenitate 
(vârstă, sex, pregătire), eterogenitate și de volum 
(număr cât mai mare de subiecţi); după Garett (citat de 
Gugiuman Ana Si colab., p.162) coeficientului r-O îl 
corespunde o eroare probabilă de 0,15 la un colectiv 
format din 20 de subiecţi, de 0,09 la un colectiv de 50 

subiecti, de 0,06 la 100 subiecţi si de 0,04 la 200 
subiecţi. 
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Stabilirea faptului existenţei unei legături între două 
fenomene nu implică în mod necesar că între cele două 
fenomene există relații de cauzalitate. Există și corelaţii 
aparente, fără fundament real. G.U.Yule (cit. Porojan D., 
p.97) a stabilit că, între 1929 și 1937, în Marea Britanie 
valoarea coeficientului de corelație dintre numărul de 
receptoare radio și numărul deficientilor mintali a fost de 
+0,988; este evident că, lăsând deoparte aspectul 
amuzant al determinării în cauză și apelând la bunul simţ, 
nimic nu dă câștig de cauză existenței unei corelaţii reale 
între cele două variabile. Metodele statistice propun soluții 
şi pentru aceste situaţii, prin intermediul corelatiilor parțiale 
sau de prim ordin (George A. F., p.389), ce au calitatea de 
a estima legătura dintre două caracteristici prin eliminarea 
efectului celei de-a treia (cu care primele două sunt 


corelate). Formula de calcul este următoarea: 


r2 naX 


In s PF 
2 2 
jl-ri x Ji — 723 


unde r, este corelatia dintre primele două variabile cu 
excluderea celei de-a treia, T este corelatia dintre 
— primele două variabile, r; Si rz reprezintă coeficienții de 
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ie e EE AET a nula a nai dia aia 
corelaţie dintre prima și a treia, respectiv dintre a doua și a 
treia variabilă. 

Să considerăm două teste (X de inteligență si Y de 
calități motrice) și să le administrăm la un grup de elevi. 
Vom vedea că între cele două există o corelație 


semnificativă si că, la un grup de elevi de clasa a IV-a- 


nivelul inteligenţei și cel al calităților motrice va fi mult mai 
crescut decât la elevii de clasa |, de exemplu. Putem 
concluziona că, o corelație a celor două șiruri se 
datorează corelatiei cu o a treia, în cazul nostru vârsta. În 
acest caz vom folosi calculul corelatiei parțiale. 
Exemplificăm cu performanțele obținute la testarea X 
(inteligența), Y (calitățile motrice) și Z (vârsta), având 
rxy=0,55 (sau r42); rz-0,60(sau F43) Si ryz=0,50( sau Tz): 


0,55— 0,60 x 0,50 


712-3 - ficos x41050? = 40,36 

Aceasta înseamnă cá indicele de corelaţie dintre primele 
două variabile (X si Y) prin eliminarea celei de-a treia (Z - 
vârsta) ar fi de 0,36; acest coeficient de mărime indică o 
corelaţie scăzută între cele două variabile. Considerând 
doar valoarea de 0,36 a lui r nu putem caracteriza destul 
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de precis relațiile dintre cele două variabile. Pentru 
aceasta, să abordà pe scurt coeficientul de determinare 


(r). 


VII.1.2 Coeficientul de determinare (r^) 


Acest coeficient este un alt mod de exprimare a 
relaţiilor dintre două variabile, în unele cazuri mai potrivit 
decât coeficientul de corelație Dacă, de exemplu, r=0,80 
şi 7240,64, atunci 64% (r*x100) din variaţia variabilei 
dependente (variabila efect) a fost explicată prin variaţia 
variabilei independente. Este mai ușor să se înțeleagă 
semnificația lui r^ decât cea a lui r. De remarcat este 
relația dintre r si r^ pe măsură ce r descrește fatà de 
valoarea sa maximă +1, r? descrește şi mai repede, 
coeficientul de corelaţie fiind 0,70 atunci când cel de 


determinare este la jumătate: 
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Revenind la corelatia parţială, avem pentru f4 
(același cu T^), r4-2=(0,55)7=0,303 si pentru lad 
(0.36)=0,127. Diferenta rezultată ținând, cont de vârstă, 
este  0,303-0,127=0.,176. Dacă 0,303 reprezintă 
coeficientul de determinare r4 dintre X si Y (deci 100%) 
atunci 0,176 (diferenta) va reprezenta 
(0 176/0,303)x100-58%. Putem spune că o corelatie 
inteligentá-caiitati motrice se datorează in 58 la sută din 
cazuri vârstei, diferența de 42% fiind asociată cu alti 


factori. 


Exerciţii 


1. Să se calculeze coeficientul de corelaţie r și de 
determinare r pentru următoarele date: 
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2. Să se calculeze coeficientul de corelatie r și de 
determinare r^ si pentru următoarele date: 
3: 


Răspunsuri: 
1. 
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CAPITOLUL VIII 
TESTE DE SEMNIFICAŢIE 


VIIi.1. ipoteze statistice 


Cercetătorul care analizează diferite fenomene cu 


ajutorul metodelor statistice este interesat în primul rând 


de caracteristicile populatiilor din care provin eșantioaneie 
de lucru Alcátuite după anumite reguli, esantioanele nu au 
alt rol decát acela de a servi ca punct de plecare pentru o 
serie de inferente asupra caracteristicilor (necunoscute! 
populațiilor, pomind de la caracteristicile cunoscute, dar 
fără relevanţă intrinsecă, ale esantioanelor. Aceste 
inferente sunt numite ipoteze statistice. Ca orice ipoteză 
de lucru, și cele statistice trebuiesc verificate, iar 
verificarea lor se realizează prin intermediul unor 
procedee specifice numite teste statistice. ipotezele 
statistice prezintă câteva particularități impuse de 
fundamentele probabilistice ale statisticii inferentiale 


. inductive: 
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a) ipotezele statistice, în cea mai mare parte a lor, se 
formulează în termenii existenţei unei diferențe între 
parametrii de sondaj și cei ai populaţiei, a două sau 
mai multe populatii, între o distribuţie de frecvenţă 
empirică și una teoretică sau între două distribuții 
empirice, verificarea ipotezelor înseamnă, în acest 
caz, evaluarea gradului de siguranță statistică 
(gradului de semnificație) a acestor diferente. 
Concordanta diferitelor ipoteze cu realitatea se 
realizează în limitele unui anumit risc (probabilitate) de 


eroare acceptat (Și stabilit) dinainte; acest risc este 
cunoscut sub denumirea de prag sau nivel de 
semnificaţie al testului folosit pentru verificarea 
ipotezelor statistice; 

b) lipsa unei sigurante depline (de 100%) conduce, 
implicit, la apritia erorilor în verificarea unei ipoteze 
statistice. 

Aceste erori sînt de două tipuri: 
a) respingerea ipotezei aunci când, în realitate, ea 
este adevărată (sau eroare de ordinul |): 
b) acceptarea _ ipotezei atunci când ea este, în | 
realitate, falsă (eroare de ordinul il, mai | 
periculoasă decât precedenta, deoarece | 
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conduce la  generalizári false, erorile 
propagându-se ulterior în lanţ). 

În cadrul cercetărilor ameliorative, organizate în 
scopul perfecționării procesului instructiv educativ, 
cercetări care în mod curent își propun drept obiectiv 
studiul unor metode, mijloace, tehnici si procedee de lucru 
în cadrul lecţiilor sau metodelor de învățare, este necesar 
să se verifice validitatea ipotezei cerectării, respectiv 
măsura în care schimbarea produsă conduce sau nu la 
progresul real al elevilor sau sportivilor. Acest aspect 
impune compararea datelor obtinute prin diverse metode 
de investigare specifice (probe de cunoștințe. de control, 
anchte, etc.) inainte si dupá incheierea experimentului (in 
cadrul aceluiași colectiv de subiecti sau între unul martor 
şi celălalt experimental). Dacă diferenţele observate se 
datorează doar întâmplării atunci crește riscul unei erori de 
gradul II; pentru a preveni această situație, în practica 
verificării ipotezelor statistice se oprează cu ipoteza care 
neagă existența acelei/acelor diferente observate de 
cercetător. Această ipoteză inversă este cunoscută în 
statistică sub denumirea de ipoteza nulă (sau a diferenţei 
nule) notată FL. În raport cu aceasta, ipoteza de lucru 


-devine o ipoteză alternativă (H1) care va fi acceptată doar 
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dacă, in urma testelor. specifice, ipoteza nulă este 
respinsă. Testarea ipotezei nule în locui celei alternative 
are ca principal avantaj micșorarea, în ceea ce privește 
ipoteza de lucru, a riscului erorii de gradul il. | 


Viii.2. 


Parametrii care caracterizeazá o populatie sint niste 
valori fixe si sint, de regulă, necunoscuţi. De exemplu, 
vârsta medie a populaţiei studenților de la facuitățile cu 
profil de educaţie fizică și sport din întreaga țară în anul 
universitar 1995-1996 este un parametru cu o valoare 
anume, stabilă în intervalul temporal de definiție a 
populaţiei. Această valoare poate fi cunoscută printr-un 
efort de inventariere a tuturor studentilor dar ea poate fi si 
estimată cu ajutorul unor eșantioane extrase din populația 
respectivă. Prin comparație cu parametrii populației, cei de 
sondaj, variază de la un eșantion la altul extras din una și 
aceeași populaţie. Revenind la exemplul anterior este de 
așteptat ca pentru 10 eșantioane aleatoare prelevate din 
populaţia de studenti să obținem 10 vârste medii diferite, 
chiar dacă foarte apropiate între ele. Parametrii de sondaj 
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sunt mărimi cunoscute (calculabile) și acest fapt, combinat 
cu dificultatea (chiar imposibilitatea, uneori) cunoașterii 
parametrilor populației (“adevărați”), evidenţiază 
importanța cunoașterii legăturii dintre cele două tipuri de 
parametrii. Cu alte cuvinte, este important să știm cât de 
reprezentativ este un eșantion pentru populaţia din care 
este extras, sau cu ce grad de precizie reușește un 
parametru de „sondaj să  estimeze (aproximeze) 
corespondentul său “adevărat”. Cu cât eșantionul este mai 


mare, cu atât estimarea va fi mai precisă; dar, uneori, nu 


putem îndeplini această condiție deoarece în domeniul 
nostru se iucrează, în general, cu grupe mici, de 10-30 
subiecţi. | 

Eroarea standard a mediei unei colectivitáti este 
dependentă de volumul esantionului (numărul de subiecţi - 
n) și de abaterea standard (S) a distribuţiei și se 
calculează după relația: 


q 
X 
|] 
Su 
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Să exeinplificăm, pentru a înțelege mai bine, cu un 
eșantion de n = 95 subiecti, abaterea standard S -+3,62 și 


media aritmeticá x =21,1: 


M J95 


0.37 

și să ne amintim de curba distribuției normale. Revanind la 
*abelul 5.1. (vezi capitolul V) căutăm în prima coloană 
¿notată z) valoarea 1,9 şi mergând în continuare spre 
areapta până în dreptul valorii ,06 vom găsi valoarea 
4750, ceea ce înseamnă că într-o distribuție normală 
2x47.50%, adică 95% din rezuhate, se încadrează între 
-1,96c; procedând identic, pentru valoarea de :2,58c 
vom afla că în acest interval vor fi cuprinse 99% din valon. 
Aceste intervale reprezintă limitele (intervalul de 
încredere) între care se află valcarea reală a mediei unei 
distributii pentru populaţia de referintà. Mai explicit, media 
unui eșantion se afiă între niște limite (să ne amintim cá 
dacă preievám 10 eşaritioane dintr-o populatie, vom avea 
10 medii foarte puţin diferite dar care se încadrează toate 
într-un același interval de variaţie) pe care le putem stabili 
cu o exactitate de 95%, respectiv 99% (dacă dorim să fim 
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mai preciși), dar niciodată de 100%. În domeniul nostru de 
activitate, pragul de semnificație cel mai îngăduitor pe 
care ni-l putem permite este de 95% (0,05). Astfel, în 
raport cu aproximatia ei într-un esantion, media se 
încadrează în intervalele: 
(scis aser 
cu o incredere de 9596 (sau probabilitate de 0,95, ceea ce 
înseamnă cá putem gresi în 5% din cazuri) 
Și 
O 


(5-25 seas T 
n n 


cu șansa de a gresi la un caz din 100 (99% încredere). 


În exemplul nostru, o,-0,37 ceea ce înseamnă că media 
“adevărată” a populaţiei din care a fost extras eșantionul 
nostru de 95 de valori este: 
| 21,1 + 1,96x0,37 
respectiv intervalul 20,37 + 21,82 
la pragul de semnificaţie 0,05 (5%) 
si 
24.1 + 2,58x0,37 
respectiv intervalul 20,14 + 22,05 
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la pragul de semnificație 0,01 (1%). 


Trebuie să remarcăm faptul că ar fi corect ca în 
locul abaterii standard a eșantionului (S) să o folosim pe 
cea a populaţiei (0), care este necunoscută; pentru 
aceasta se aplică, de către cei care vor să fie foarte preciși 
în calculele lor, corectii ale lui S pentru a aproxima cât mai 


exact pe o (corectia lui Bessel). 


VIII.3. Comparatia mediilor (testul lui Student - t) 


Mediile a două șiruri de date pot să difere 
nesemnificativ (întâmplător) sau semnificativ; în cazul unei 
difernte semnificative se poate presupune (şi argumenta) 
prezența unui factor sistematic care a produs diferenţa, 
dar nu se poate demonstra că acest facior va produce 
același efect şi la alte eșantioane, aparținând aceleiași 
populații statistice. 

În practica experimentală se întâlnesc mai multe 
situaţii (în care se cere diferențierea dinire medii), cum ar 
fi: când sirurile sint corelate sau necorelate, cànd abaterile 


— 
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standard sînt cunoscute sau nu, etc., fiecare situație 
având propria formulă și algoritm după care se calculează 
parametrul "t". Parametrul t este cu atât mai mare cu cât 
diferenta dintre medii este mai mare și cu cât abaterile 
standard ale sirurilor respective sînt mai mici. Când î 
calculat este mai mare decât o valoare t teoretică tabelată 
(vezi tabelul 8.1), în funcţie de numărul de cazuri si pragul 
de semnificaţie despre care am vorbit anterior, la 
estimare. atunci ipoteza de nul (a diferenţei întâmplătoare 
dintre medii) se infirmă; rezultă, cu o probabilitate 
acceptabilă, că mediile celor două eșantioane diferă 
semnificativ. Cea mai des întâlnită situaţie în practică este 
cea a metodei experimentale unde, prin testul lui Student, 
se urmăreşte argumentarea diferenței semnificative dinire 
media unui eșantion experimental față de media unui 


eşantion martor (de control). 


VIIL2.1 Semnificatia diferentei dintre medii pentru 


esantioane distincte 


|. Sá presupunem că am testat douá colective diferite 
(n, respectiv n, subiecti), provenite din aceeaşi populatie, 
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cu aceeași probă de contol și le-am calculat mediile 
aritmetice (x și y) şi abaterile standard (S, și S). Afirmám, 
utilizând ipoteza nulă, că între cele două eșantioane nu 
există nici o diferență. Aplicăm testul lui Student pe baza 


relaţiei: 


Să exemplificăm (după Gugiuman Ana și colab., 
p.168) cu două colective de 30, respectiv 36 de elevi care, 
la sfârșitul anului școlar au avut mediile generale pe clasă 
de 8,20 prima și 7,50 a doua, cu abaterile standard 
$,-1,77 şi S,=1,86. Plecând de la ipoteza nulă, între 
mediile generale ale celor două clase de elevi nu există 
diferențe semnificative (sau altfel spus diferența este zero) 
ci doar factori întâmplători au determinat o oarecare 
diferență (de 0,70). Aplicând testul lui Student avem: 


,..1820-750 — 0,7 «179. 


2 2 BB 345 
1,77? _ 186° [313 | 345 
30 36 30 36 
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În tabelul cu valorile repartitiei Student vom căuta în 
prima coloană din stânga valoarea 64 - în tabelul nostru 
vom citi la 60 - (obţinută din suma gradelor de libertate 
corespunzătoare fiecărui sir, respecti 30-1+36-1) și vom 
găsi în dreptul valorii de probabilitate 0,05 cifra 2,00 , iar 
pentru o probabilitate de 0.99 (0,01) valoarea 2,66. 
Comparând valoarea calculată de noi t=1,79 cu cele 
teoretice, vom remarca faptul că în ambele cazuri aceasta 
este mai mică 1,79<2<2,66 ceea ce ne dă posibilitatea să 
acceptăm ipoteza nulă și să afirmăm că între elevii celor 
două clase nu este o diferenţă de valoare considerabilă, 


cu riscul de a greși în 5 respectiv 1% din cazuri. 


VIII.3.2. Semnificaţia diferenţei dintre medii pentru 
esantioane corelate 


De multe ori, un același grup de subiecţi este supus 
la -probe diferite ( de exemplu, dacă se modifică 
performantele unor sportivi la administrarea unui 
medicament) rezultând perechi de valori pentru fiecare 
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subiect, ce pot fi corelate. Dacă notăm cu D diferența 
dintre rezultatele obținute de fiecare individ din grup la 
cele două teste, testul t se calculează după formula: 


să considerăm că performanţele a.zece sporiivi au 
isst înregistrate înainte (X) și după (Y) un cantonament și 


s-au obținut următoarele rezultate: 


Apelând la testul Student avem: 


t= -—— md a 1073. 
10x127-(-13) D -169 
e 30-1 ? 


L M A a 
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————————— LLL 


Valorile repartitiei Student in functie de i 
probabilitate 
și numărul gradelor de libertate (f) su 
Tabel 8.1 


3,707 
3,499 


11 2,201 2,718 3,106 

12 2.179 2,681 3,055 
| 13 2,160 2,650 3,102 
«14 2,145 2,624 2977 
E A cei erai ZO02 35 2047-5 i 


16 2,120 2,583 2,921 
17 2,110 2,587 2,898 

18 2,101 2,552 2,878 

19 2,093 2,539 2,861 
Ee OE D isi OA Dar: 
21 2,08 2,518 2,831 

22 2,074 2,508 2,819 
23 2.069 2,500 2,807 
24 2.064 2,492 2,797 


D TES iei 


p Amit 


27 2,052 2473 2771 
28 2,048 2,467 2,763 
29 2,045 2,462 2,758 
35 2,030 2,438 2,724 
40 2,021 2,423 2,704 
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De această dată căutăm în tabelul 8.1 în dreptul valorii 
obținute din numărul gradelor de libertate ale grupului 
nostru (nu se tine cont de semnul minus), deci la n-1:=10- 
1=9 şi vom găsi pentru probabilitatea de 0,05 valoarea 
2,262 si respectiv 3,250 pentru o probabilitate de 0,01. Si 
in acest caz ipoteza de nul se confirmă, între cele două 
testări neexistând diferențe semnificative 
(1,175<2,262<3,250) ceea ce ne-ar permite să afirmăm că 
în condiţiile de cantonament rezultatele obtinute în final nu 
sunt diferite de cele initiale. cu probabilitatea de a avea 


dreptate în 99% din cazuri. 


Exercitiu: 


Aplicati testul t pentru calcularea diferenţei dintre medii - 


pentru următoarele șiruri corelate: 


Răspuns: t = 2,077 eum 9 grade de libertate < 
.2,262 - nesemnificativ. 


CE Scanned with OKEN Scanner 


116 


| CAPITOLUL IX 


PREZENTAREA DATELOR STATISTICE 


Rezultatele prelucrărilor statistice se prezintă cu 
ajutorul tabelelor statistice și se reprezintă cu ajutorul 
graficelor. | | 


| IX.1. Tabelele statistice 


Tabelele statistice constituie principala formă de 
prezentare a rezultatelor prelucrării statistice. Importanta 
tabelelor statistice constă în faptul că ele ne ușurează 
compararea și înțelegerea fenomenelor prezentate. Cu 
ajutorul lor caracterizăm sugestiv nivelul, structura, 
dinamica Si repartiţia teritorială a fenomenelor sociale, 


economice, etc. 


IX.1.1. Elementele tabelului statistic 


Orice tabe! statistic este format din următoarele 


elemente structurale de bază: 


Pi EM Et AR PE SIA EROI. VA SANSA N "VAIDA Pe RS ma ra acu a mea 


it a IE RI PUTIN a 
pe 
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1) Macheta tabelului, constituită din 

a) scheletul tabelului, format dintr-o reţea de linii 
orizontale și verticale care, prin intretàiere, 
formează rânduri, coloane și rubrici (din 
întretăierea rândurilor şi coloanelor rezultă 
rubricile, în care înscriem datele numerice); 

b) titlurile tabelului, cuprind . titlul general al 
tabelului, titlurile rândurilor și ale coloanelor; 


2) Subiectul tabelului, arată despre ce colectivitate este 
vorba în tabel. El este dat de titlul general al tabelului și de 
titlurile rândurilor. Titlul general al tabelului se așează în 
partea superioară a tabelului şi cuprinde obiectul despre 
care se vorbeşte în tabel, spaţiul și timpul la care se referă 
datele, iar titlurile rândurilor se trec la capetele acestora; 
3) Predicatul tabelului, ne arată acțiunea subiectului și 
este format din denumirea caracteristicilor prin care este 
descrisă colectivitatea cercetată, precum şi din cifrele care 
arată nivelul lor de dezvoltare. El figurează de obicei la 
capetele coloanelor, 


CE Scanned with OKEN Scanner 


118 | 
4) Datele numerice, se inscriu in rubricile tabelului $i se 
prezintá sub forma indicatorilor absoluti si derivati (mărimi 
relative, medii și indici); 
5) Nota explicativă, se înscrie uneori sub tabel si ne indică 
sursa datelor și metodele folosite pentru obținerea 
diferitilor indicatori. Ea însoțește tabelul în cazurile în care 


sînt absolut utile anumite explicații. 


IX.1.2. Tipuri de tabele statistice 


După modul de prelucrare si prezentare, tabelele 
statistice pot fi: 


1. Tabele simple, ce prezintă colectivitatea nedespártità 
în grupe titpice. Ele se folosesc în scopuri informaiive 
și de raportare; E 

2. Tabele pe grupe, prezintă colectivitatea despărțită în 
grupe omogene pe baza unei singure caracteristici de 
grupare, indiferent dacă aceasta se exprimă prin 

cuvinte sau cifre(tabelul 9.1, în care caracteristica de 

grupare se exprimă prin cuvinte - admisi, respinsi); 
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3. Tabele combinate, prezintă colectivitatea despărțită în 


grupe omogene pe baza a cel puţin două caracteristici 
de grupare folosite simultan (tabelul 9.2). 


Situația după probeie eliminatorii 
| Tabel 9.1 


T e oU gue m. mds ab spa a agnum t atc "alt 


Porte iert d 
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Tabelele combinate sînt mai bogate în conținut deoarece 
ne oferă mai multe informații asupra colectivități 


prezentate. 


Situaţia după probele eliminatorii 


Tabel 9.2 
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lată câteva reguli mai importante pentru alcătuirea 


tabelelor statistice: 


orice tabel statistic trebuie să aibă un titlu scurt, 
clar şi complet, din care să rezulte fenomenul 
prezentat, timpul si spaţiul unde acesia se 
desfășoară; 

alegerea formei tabelului (simplu, pe grupe. 
combinat) nu se face la întâmplare, ci în functie 
de conţinutul fenomenului ce. urmează a fi 
prezentat și de scopul urmărit; 

subiectul se înscrie în tabel de obicei !a 
capetele rândurilor. iar predicatul ia capetele 
coloanelor; 

rândurile si coloanele trebuie să fie dispuse, în 
tabel, logic; 

trecerea indicatorilor în tabe! se 
importanței lor; 

pentru fiecare indicator trebuie indicată unitatea 
de măsură; dacă aceasta este comună pentru 
toti indicatorii poate fi menționată deasupra 


tabelului. 


face în ordinea 
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IX.2. Reprezentările grafice 


Graficele sînt un mijloc de reprezentare expresivă a 
datelor statistice cu ajutorul liniilor, punctelor, figurilor 
geometrice, figurilor naturale și simbolice. | | 

Ele capătă o răspândire tot mai largă în statistică 
datorită următoarelor avantaje: 

e inlesnesc compararea și memorarea datelor, 

datorită caracterului sugestiv și intuitiv; 

e evidenţiază nivelul, structura și deplasările 

structurale ale fenomenelor studiate; | 

e caracterizează dinamica fenomenelor. 

e constituie un mijloc important de popularizare a 


datelor. 


IX.2.1. Elementele reprezentării grafice 


Elementele principale ale unui grafic sînt: 
1) Titlul graficului, care trebuie să fie scurt, clar, complet 
și să corespundă cu titlul tabelului ale cărui date 
numerice le reprezentăm grafic. Din titlu trebuie să 
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reiasă fenomenul reprezentat, timpul și spatiul de 
desfăşurare a fenomenului respectiv; 

Scara de reprezentare, se compune din suportul scării 
(o linie) dispusă vertical sau orizontal, care este 
divizată printr-un șir de puncte numerotate. Ea are o 
limită inferioară și una superioară, iar distanța dintre 
limitele extreme ale scării se numește lungimea scării, 
distanta dintre grupele de puncte se numește intervalul 
graficului, iar distanța dintre valorile numerice (ale 
punctelor) se numește interval numeric; 

Reteaua graficului. este formată din linii paralele 
dispuse vertical sau orizontal, din linii încrucișate sau 
cercuri concentrice, care servesc la construirea 
graficului, purtând denumirea de rețea ordinară; 
Explicarea semnelor convenționale, se face fie cu 
ajutorul unor inscripții în chenar, fie cu ajutorul unei 
legendei. La inscripții în chenar, explicatile referitoare 
la graficul întocmit figurează într-un spațiu specia! 
deiimitat, prezentând astíel avantajul că ușurează 
citirea si reținerea datelor din grafic. legenda este o 
explicație sistematică a semnelor folosit în grafic. Ea 
se înscrie de regulă în afara graficului, sub rețea sau în 


partea dreaptă a graficului; 
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5) Figurile cu care facem reprezentarea, constituie 
elementul de bază al graficului. În funcţie de natura 
seriei ale cărei date numerice urmează a fi 
reprezentate, aceste figuri pot fi geometrice, naturale, 


simbolice sau hărți. 


IX.2.2. Reprezentarea grafică prin diagrame (figuri 
geometrice) E. | 


Diagramele se folosesc fie pentru reprezentarea 


structurii colectivitátii, fie pentru reprezentarea unor . 


indicatori de volum. Condiţia de bază care trebuie 
permanent avută in vedere în cazul diagramelor de volum 
este ca aria figurii geometrice să fie direct proporțională cu 
mărimea indicatorului reprezentat. 

Cele mai utilizate sînt diagramele prin pătrate Si 
cele prin cercuri (în cazul indicatorile de volum), 
dreptunghiul si cercul de structură, histograma sau 
poligonul de frecvență (vezi capll.2) (pentru structura 
 colectivitàtii), diagramele prin coloane sau benzi (in 
variante bi- si tridimensioanle). Dar, să le analizăm pe 


scurt, pe fiecare dintre ele. 
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Sá considerăm că în urma unei testări A, trei 
subiecţi au obținut următorul punctaj: 


Tabel cu numărul de puncte obținute în urma testării A 
Tabel 9.3 


t > 
IX EPISC F 
h iar eb 
CAET qr 2 * 


Pentru reprezentarea folosind o diagramă prin pătrate se 
extrage rădăcina pătrată din numărul punctelor obținute de 
fiecare din cei trei subiecți: 

X: | =+/64= 8 puncte; | 

| Y:1 24817 9 puncte; 

Z: 1-100 = 10 puncte. 
În funcţie de spaţiul disponibil se alege unitatea de 
lungime a scării de reprezentare. De exemplu, ea poate fi 
de 1cm și atunci vom avea trei pătrate cu laturile (I) de 8, 
9, respectiv 10cm, sau să zicem de 2cm şi atunci lungimile 


„laturilor vor fi 4, 4,5 respectiv Sem: 
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Fig. 9.1 Numărul de puncte 
obținute de cei trei subiecți în 
urma testului A 


Pentru diagrama prin cercuri se parcurg aceleași 
etape cu deosebirea că pentru aflarea razei R a cercului 


de reprezentat se extrage rădăcina pătrată din raportul 


dintre valoarea obținută și m: (X) R = I = 4.514 


puncte, etc. 

Reprezentarea grafică a structurii colectivitátii se 
face în funcţie de seriile de distribuţie, care sint de două 
feluri: calitative și cantitative. 

În cazul seriilor cantitative datele numerice se 
reprezintă grafic cu ajutorul histogramei și poligonului de 
frecvenţă, pe care le-am tratat la cap.ll. 

Reprezentarea structurii seriilor calitative se face 
cu ajutorul diagramelor structurale (dreptunghi sau cerc 
de structură); suprafețele acestora sînt egale cu 100%. iar 
părțile lor sînt reprezentate prin porțiuni de suprafață. 


CE Scanned with OKEN Scanner 


126 


Să considerăm următoarea serie calitativă (tabelul 
9.4) rezultată ai^ opțiunile făcute de studenții unei facultăți 


Opțiunile exprimate de studenți pentru specializarea într-o 
disciplină sportiivàá 


”otbal 
Handbal 
Atleusm s- 
Velei ZOZ 

Baschet 


E pă om mii V e "rtl L 
^ STA " t - 


De e a 


într-o disciplină sportivă 
Constructa dreptungriului de structură începe prin 


alegerea unei scâri de frecvență dispusă vertical, pe care 
o divizăm în părți 10 egaee, fiecare parte reprezentând 


Optiunile pentru specializarea într-o disciplină 
vi 
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| 10% (fig.9.2). 
| Cercul de structurá se obtine prin reprezentarea 
ariei in procente volum total (10096). Pártile componente 
vor fi reprezentate prin sectoare de cerc ale cáror arii vor fi 
proporționale cu mărimile relative de structură (360° 
reprezintă 100% din arie, iar sectoarele de cerc se obțin 


Opțiunile pentru specializarea într-o 
disciplină sportivă | 


WFotbal } 
E] Handbai | 
D Atletism 
I3 Volei 
EI] Baschet 


prin regula de trei simplă) (fig. 9.3). 

Diagrama prin coloane este cea mai frecventă 
formă de reprezentare grafică întâlnită în statistică. 
Coloanele sînt dreptunghiuri cu baza egală și înălțimea 
direct proporțională cu mărimea indicatorilor reprezentaţi; 
ele sînt dispuse la distanță egală una de alta, distantă ce 
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reprezintă jumătate din lungimea bazei coloanelor (fig. 


9.4). 


Optiuniie -entru specializarea intr- 
o disciplină sportivă 
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Discipline sportive ura 9.4 


Opțiunile pentru specializarea into] 
disciplină sportivă i 


pup ep End 


Disciplina 
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Nr. opțiuni Figura 9.5 
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coloane, este realizată tot din dreptunghiuri, dar dispuse 
orizontal (fig. 9.5). 

În reprezentare tridimensională, cercul de structură, 
diagrama prin coloane precum și cea prin benzi sînt 
aparent mai “profesionale”, dificultatea constând doar (în 


b 


cazul ultimelor două) în faptul că e destul de greoi să 


Opțiunile pentru specializarea într- | 
o disciplină sportivă 


citeşti valorile înscrise, tocmai datorită reprezentărilor în 
trei axe: 
Reguli pentru construirea graficelor: 

e orice grafic trebuie să aibă un titlu scurt, clar și 


cuprinzător; 
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e scara graficului trebuie să fie astfel construită 
incât să  evidentieze variația fenomenului 


reprezentat; 


Op]iunile pentru specializarea ntr- 
o disciplim sportivi 


Diagrams tridimensională (prin coloane) 


+ notarea c'felor pe scara verticală (axa Y) se 
face în partea stângă. iar pe scara orizontală 
(axa X: aedesupt. Scara trebuie să ne indice 
fəlul indicatorilor cu ajutorui cărora reprezentăm 
fenomenul: mărimi absolute, relative, medii, 
indici; 

"+ legenda se așează, de obicei, în partea dreaptă. 
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CAPITOLUL X 


STATISTICA SI SISTEMELE DE CALCUL 


Realizare importantă a industriei de tehnică de 
calcul din ultimii ani, calculatorul personal are utilizatori 
din cele mai diverse categorii sociale: ingineri, economiști, 
tehnologi, proiectanți, matematicieni, fizicieni, chimisti, 
medici. meteorologi, profesori, functionari, artiști, 
muncitori. sportivi, cercetători, elevi, etc. Explicaţia constă 
în virtutile acestui echipament, dinire care se detașează: 

e viteza mare de calcul; | 
accelerarea procesului decizional folosind un 


mare volum de informații stocat și prelucrat 


€ 


corespunzător; 
e creșterea calității cercetării științifice și proiectării 
tehnologice; — 
folosirea cu rezultate superioare a resurselor 


materiale și umane, | 
rviciilor si, nu în ultimul rând, 


paleta largă de divertisment oferită de *jocurile 
raficá si ilustrare muzicalá 


perfectionarea se 


pe calculator” cu o g 


extrem de aigactive. 
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Se alătură acestor calități și faptul că un calculator 
personal! (PC) are un gabarit mic și o greutate redusă, 
este interactiv Si ușor de deplasat și montat unde se 
dorește și se caracterizează printr-un pret accesibil. 

in prezent, calculatorul nu mai este un obiect 
prețios care provoacă uimire, ci tinde mai curând să 
capete rolul de instrument util ȘI foarte răspândit, devenind 
o componentă de neînlocuit în viata de toate zilele, de la 
locul de muncă și până la momentele de folosire a timpului 
liber. Şi totuși, în intervalul de numai câtiva ani, el a 
modificat profund viața socială ȘI a transformat orice tip de 
informatie, cu o capacitate de penetratie pe care nici 
mácar inventatorii lui nu si-ar fi inchipuit-o in urmá cu 
numai 50 de ani. 

Computerul nu este totuși doar un “calculator”, în 
accepțiunea literală a termenului, în sensul cà el nu 
tratează numai numere, ci prelucrează, în acceptiunea cea 
mai largă a cuvântului, informaţii. În primui rând a cucerit 
foarte rapid rangul de produs comercial la preturi din ce în 
ce mai accesibile. Calculatorul - desi este printre ultimii 


apăruți în familia produselor electronice - a devenit o 


realitate caracteristică a sccietátilor industriale dezvoltate | 


(sau postindustriale), astfel încât “putem evalua gradul de 
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dezvoltare a unei societăți după numărul de calculatoare 
utilizate”( Giovannini G., p.216). Capacitatea sa uluitoare 
de a prelucra informatii, de a memora cantități imense de 
date la costuri tot mai scăzute și de interactivitate asigură 
calculatorului un rol fundamenta! în însăși evoluția 
societății de mâine. Generaţia actuală de calculatoare 
personale posedă programe (aplicaţii) special construite 
pentru a putea fi folosite de orice persoană si nu numai de 
către specialiști ( cei pe care proaspetii initiati și nu numai 
ei, îi privesc ca pe nişte “guru” ai domeniului). Cu cât PC- 
uri-le sint mai rapide si mai complexe, cu atât programele 
sunt mai uşor de utilizat și pot realiza mai multe operatii. 
Datorită computerelor, modalitatea statistică de 


prelucrare a datelor și chiar a informaţiilor a devenit una 


din cele mai răspândite și utilizate, în toate domeniile 
abordabile ştiinţific. Si in domeniul educatiei fizice $i 


sportului, comunitatea academică recunoaște şi apreciază 


importanţa instrumentului de cunoaștere statistic, interesul 
u-se preponderent pentru statistica aplicată 


manifestând 
uri profesionale pentru prelucrari 


pe PC, respectiv soft- 
statistice de date. 
Produs al arhicunoscutei, de acum, firme Microsoft, 


sistemul Windows se bucură în prezent de o mare 
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popularitate si in tara noastră, find cea mai folosită 
interfață grafică utilizator. 

între aplicaţiile care rulează sub Windows și care 
fac parte din pachetul MS-Office, poate cea mai 
performantă este Excel (Fig.10.1) care oferă posibilități de 
lucru cu foi de calcul tabelar (spreadsheet-uri), alcătuind o 
agendă de lucru impresionantă, formată din 16 asemenea 
foi, constituite fiecare dintr-un număr consistent de linii 
(16384, numerotate 1, 2, 3, ... , 16384) și de coloane (256 
notate cu A, B, C, AA, AB, ... , IV). 


Ă mut 
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"Fig. 10.1 Fereastra de ceru curentă în Excel 
j (cu evidentierea ultimei celule) 


Această aplicaţie oferă utilizatorilor domeniului 
nostru (fie ei studenti, cadre didaciie sau cercetători 
consacraţi) diverse facilități cum ar îi calcule și analize 
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statistico-matemetice, interpretări ale datelor obţinute în 
urma acestor calcule, proiectarea bazelor de date și 
probleme de decizie și raportări. 

Un dezavantaj major îl constituie, pentru specialiștii 
nostri, lipsa unei documentatii care să facă “lumină” 
asupra utilității acestui produs și ale posibilităţilor lui de 
folosire de către studenții sau cadrele didactice din 


facultățile de profil. 


Functii statistice predefinite de largă utilizare în aplicația Excel 
l Tabei 10.1 _ 


DT pt fie e e 


10. Standardize L. naona mezi ee erat n cant a tată 

11. Correl i Wetten i MAE 
Pearson 

12. Confidence 

13. Ttest 


Numărul funcţiilor statistice pe care le considerăm 


că sunt facile este de 13 funcţii de largă utilizare, la care 
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se pot adauga permanent altele noi legate de necesitățile 
şi cunoștințele fiecăruia (Tabel 10.1). Procentual, acesta 
reprezintă doar 18,3% din totalul de 71 de functii statistico- 
matematice predefinite disponibile în această aplicaţie. 

Așa cum spuneam anterior referitor la problemele 

de raportări și de decizie, XL se dovedeşte un instrument 
foarte putemic în ceea ce privește posibiliiătile de 
exprimare grafică a diverselor rezultate. Numai dacă 
amintim faptul că oferă posibilitatea de a alege inire 15 
duri distincte de reprezentare a graficelor, care la 
rândul lor, prin variante, conduc la o “paletă” ce sumează 
102 posibilități bi- ȘI tridimensionale de a te face înțeles și 
altfel decât prin cifre care, uneori, sunt mai relevante într-o 
astfel de vizualizare, ne. dăm seama de reala utilitate a 
acestui produs soft. 

Si aproape nimic din tot ceea ce am spus până aici 
nu ar avea valoare dacă nu am aminti despre facilitățile pe 
care le oferă această aplicație în crearea și gestionarea 
bazelor de date, care, până la urmă, reprezintă materialul 
de prelucrat și de reprezentat. O bază de date esie un 
instrument folosit pentru depozitare, organizare si 
extragere de informatii. Scopul creárii unei baze de date 


este nu atât acela de a calcula noi valori, ci mai degrabă 
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de a stoca o multime de informaţii într-o manieră coerentă. 
Păstrarea unei mari cantități de date într-un format tabelar 
reprezintă doar o mică parte a “filosofiei” bazelor de date 
în programul Excel. 

Flexibilitatea ordinii înregistrărilor este exact ceea 
ce se cere pentru a putea rezolva toate problemele legate 
de gestionarea datelor. Comanda Sort (din meniul Data) 
oferă această flexibilitate, acesteia  aláturindu-l-se 
AutoFilter pentru a filtra baza de date, cu scopul de a afișa 
numai acele înregistrări care conțin o anumită valoare. 

În urma tratării tutror acestor aspecte, sintetic, se 
poate concluziona, în ceea ce privește aplicația Excel, că: 

e este deosebit de utilă cunoașterea cât mai 
aprofundată a posibilităţilor pe care le oferă în 
utilizare domeniului nostru de activitate; 

e realizeză formarea utilizatorului (cea mai mare 
parte a acestora fiind în prezent studenții) în 
vederea creşterii valorii studiilor științifice; 

e indirect, creşte obiectivitatea studiilor științifice, 

prin exprimări cifrice (sau conexiuni logice) a 
datelor; 
creşte precizia dalo! ità facilitátilor de căutare si 


sortare disponibile pentru baze de date; 


NM 
————————ÀÓ— —— 
(————— e ae 
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e ordonează întreaga activitate de lucru cu 
calculatorul, ceea ce duce implicit la scăderea 


sensibilă a timpului de lucru. 


Foarte puțini din utilizatori ştiu însă că, o aplicaţie 
orientată în principal pe desenare de grafice, include Si 
posibilități de lucru cu funcții, între acestea incluzâdu-se și 
functiile statistice. Aceasta se numește CorelCHART! 
(aplicaţie prezentă în pachetul CorelDRAW!, produs al 
firmei Corel Corporation) si este un program de grafică 
(desen) vectorială - “are o interfață intuitivă care îl face 
uşor de învățat dar, totodată, greu de stăpânit (Gray D., 
p.1) el pune la dispoziția utilizatorului, printre altele, 


- Cerci CHART - [Data - Untitled 1] ] ME 
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instrumente pentru scrierea formulelor și funcții pentru 
calcularea datelor din diagrame (fig.10.2). 

CorelCHARTI Conţine peste 300 de functii pentru 
următoarele tipuri de operații: 


functii de conversie; 

functii pentru oră și dată; 

funcţii DDE (Dynamic Data Exchange) și 
externe; 

funcții pentru calcule inginerești; 

funcții pentru caicule financiare: 

funcții iogice: 

functii matematice ŞI trigonometrice; 


functi staustice, etc. 


Funcţiile din această aplicație lucrează ca si cele din 
aplicaţiile cele mai răspândite de calcul tabelar; ea pune là 
dispoziție o foaie de calcul cu 256 de coloane (etichetate 
cu litere de la A la IV) si 16384 de linii (notate cu cifre de 
la 1 la 16224). Utilizatorii cu o oarecare experiență în 
lucrul cu aplicaţiile de calcul tabeiar (Excel, Lotus 1-2-3) 
vor constata că formulele si funcţiile din CorelCHART! le 
sunt foarte familiare} 
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Pentru a putea opera cu oricare din functiile 


prestabilite enunțate mai sus se apelează meniul Data, 


comanda Enter Formula (F42) meniul derulant Functions; 


Corel CHART - [Data - Untited-!] 


fos E |» | 


pehet 
Ae 


Fig. 10.3 
în cazul nostru ne vom opri la cele statistice (Statistical, 


fig.10.3). 

Aplicația pune la dispoziţie pentru calculele 
statistico-matematice a sirurilor de date recoltate în urma 
măsurilor un număr destui de mare de runctii (65), dar 
inferior celor din aplicaţia “rivală” Excel (care în varianta 
5.0 cuprindea 71 de asemenea funcții, număr ce a crescut 
ulterior în varianta recentă '97). Evident, un cercetător din 
domeniul nostru de activitate care este în același timp și 


utilizator al acestei aplicaţii, nu va fi nevoit aproape 
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niciodată să le cunoască și să le folosească pe toate. 


Tocmai de aceea, pentru a veni cu un minim de informaţie 


| in această directie, vom trece în revistă, foarte pe scurt, pe 
câteva dintre acesiea, pe cele pe care le socotim a fi mai 


des utilizate (tabei 10.2): 


Funcții statistice în CorelCHARTI De largă utilitate 
Tabel 10.2 


Denumirea funcției Ur ate — IL mier 
g e 
2. median 
i3. mode 


å. max 


5. min 
6. avedoev. 


12. ttest 


ceast program, deși 


Opinia noastrá este cá in a 
u calcului 


destinaţia principală esie crearea de grafice şi n 
tabelar, Help-ul este construit 
aceesibilà, mai concis Si cu exemple m 


cuvinte - dar nedorind sub nici o formă să îi criticăm pe cei 


ai clare. Cu alte 


într-o engleză mai 
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de la Microsoft - în acest caz help-ul ajută într-adevă 
utilizatorul! 

Nu putem omite, în încheiere, numirea și a altor 
programe care înlesnesc munca cercetătorului, cum ar fi 
SPSS, Statistica for Windows, etc. Ar mai fi de precizat 
că, “din păcate, ceea ce, de cele mai multe Ori, este trecut 
sub tăcere, este faptul că acest instrument de cunoastere, 
dacă nu este folosit adecvat, duce la concluzii eronate sau 
abuzive. [...] Mai important decát a Sti pe care butoane să 
apăsăm esie, însă, să ştim ce semnificaţie au cifrele seci 
ale statisticii si cât de muit ne putem baza pe ele (Gagea 
A., p.40-41)." 
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